(19)【発行国】日本国特許庁(JP)
(12)【公報種別】特許公報(B2)
(11)【特許番号】
(24)【登録日】2024-07-12
(45)【発行日】2024-07-23
(54)【発明の名称】スカラー量子化従属性のためのスカラー量子化器決定スキーム
(51)【国際特許分類】
H04N 19/13 20140101AFI20240716BHJP
H04N 19/157 20140101ALI20240716BHJP
H04N 19/91 20140101ALI20240716BHJP
H04N 19/176 20140101ALI20240716BHJP
H04N 19/12 20140101ALI20240716BHJP
H04N 19/18 20140101ALI20240716BHJP
【FI】
H04N19/13
H04N19/157
H04N19/91
H04N19/176
H04N19/12
H04N19/18
(21)【出願番号】P 2021506651
(86)(22)【出願日】2019-09-13
(86)【国際出願番号】 US2019051089
(87)【国際公開番号】W WO2020060867
(87)【国際公開日】2020-03-26
【審査請求日】2022-09-09
(32)【優先日】2018-09-21
(33)【優先権主張国・地域又は機関】EP
(32)【優先日】2019-05-20
(33)【優先権主張国・地域又は機関】EP
(73)【特許権者】
【識別番号】518338149
【氏名又は名称】インターデジタル ヴイシー ホールディングス, インコーポレイテッド
(74)【代理人】
【識別番号】100079108
【氏名又は名称】稲葉 良幸
(74)【代理人】
【識別番号】100109346
【氏名又は名称】大貫 敏史
(74)【代理人】
【識別番号】100117189
【氏名又は名称】江口 昭彦
(74)【代理人】
【識別番号】100134120
【氏名又は名称】内藤 和彦
(74)【代理人】
【識別番号】100108213
【氏名又は名称】阿部 豊隆
(72)【発明者】
【氏名】チェン,ヤ
(72)【発明者】
【氏名】ル リアネック,ファブリス
(72)【発明者】
【氏名】ポワリエ,タンギ
(72)【発明者】
【氏名】ド ラグランジュ,フィリップ
【審査官】田部井 和彦
(56)【参考文献】
【文献】国際公開第2020/007785(WO,A1)
【文献】特表2021-530155(JP,A)
【文献】特開2018-110405(JP,A)
【文献】Heiko Schwarz et al.,CE7: Transform Coefficient Coding and Dependent Quantization (Tests 7.1.2, 7.2.1) [online],JVET-K0071(JVET-K0071.doc), [2023年10月20日検索],インターネット <URL: https://jvet-experts.org/doc_end_user/documents/11_Ljubljana/wg11/JVET-K0071-v2 .zip>,2018年07月11日
【文献】Heiko Schwarz et al.,Non-CE7: Alternative Entropy Coding for Dependent Quantization [online],JVET-K0072(JVET-K0072.doc), [2023年10月14日検索],インターネット <URL: https://jvet-experts.org/doc_end_user/documents/11_Ljubljana/wg11/JVET-K0072-v1.zip>,2018年07月03日
【文献】Heiko Schwarz et al.,Hybrid Video Coding with Trellis-Coded Quantization [online],Published in: 2019 Data Compression Conference (DCC), [2023年10月20日検索],2019年05月13日,pp.182-191,インターネット <URL: https://ieeexplore.ieee.org/stamp/stamp.jsp?tp=&arnumber=8712696>,DOI: 10.1109/DCC.2019.00026
(58)【調査した分野】(Int.Cl.,DB名)
H04N 19/13
H04N 19/157
H04N 19/91
H04N 19/176
H04N 19/12
H04N 19/18
IEEE Xplore
(57)【特許請求の範囲】
【請求項1】
方法であって、
ピクチャのブロック内の第1の変換係数に関連する第1のパラメータセットをエントロピー復号することであって、前記第1の変換係数が、復号順序で前記ピクチャの前記ブロック内の第2の変換係数に先行する、ことと、
前記第2の変換係数に関連する第2のパラメータセットをエントロピー復号することであって、前記第1および第2のパラメータセットが、バイナリ算術コード化エンジンの通常モードでエントロピー符号化され、前記第2の変換係数の前記第2のパラメータセット内の少なくともパラメータのコンテキストモデリングが、前記第1の変換係数の復号に依存し、前記第1および第2のパラメータセットが前記ブロックの第1のスキャンパスでエントロピー復号され、前記第1のスキャンパスが、前記ブロックのエントロピー復号変換係数についての1つ以上の他のスキャンパスの前に実行され、前記第1および第2の変換係数についての前記第1および第2のパラメータセットの各セットが、少なくともSIGフラグ、第1のフラグおよび第2のフラグを含み、前記SIGフラグが、対応する変換係数がゼロであるか否かを示し、前記第1のフラグが、前記対応する変換係数の絶対値が1よりも大きいかどうかを示し、前記第2のフラグが、前記対応する変換係数の絶対値が2よりも大きいかどうかを示し、前記第2の変換係数を逆量子化する逆量子化器が、前記第1の変換係数に関連付けられる前記第1のパラメータセットの前記SIGフラグ、前記第1のフラグ、及び前記第2のフラグの和又はXOR関数に基づいて、2つ以上の逆量子化器から選択される、ことと、
前記復号された変換係数に応答して前記ブロックを再構築することと、
を備える、方法。
【請求項2】
前記第2の変換係数を逆量子化する逆量子化器が、前記第1の変換係数に基づいて、2つ以上の量子化器から選択される、請求項1に記載の方法。
【請求項3】
前記逆量子化器が、前記第1の変換係数の前記第1のパラメータセットに基づいて選択される、請求項2に記載の方法。
【請求項4】
前記逆量子化器が、前記第1のフラグ、前記第2のフラグ、または前記第1のパラメータセットの別のフラグに基づいて選択され、前記別のフラグが、前記対応する変換係数の絶対値がxよりも大きいかどうかを示す、請求項2に記載の方法。
【請求項5】
前記SIG、第1、第2のフラグ、または別のフラグのコンテキストモデリングが、前記量子化器または前記量子化器の選択において使用されるステートに基づく、請求項4に記載の方法。
【請求項6】
1つ以上のプロセッサを備える装置であって、前記1つ以上のプロセッサが、
ピクチャのブロック内の第1の変換係数に関連する第1のパラメータセットをエントロピー復号することであって、前記第1の変換係数が、復号順序で前記ピクチャの前記ブロック内の第2の変換係数に先行する、ことと、
前記第2の変換係数に関連する第2のパラメータセットをエントロピー復号することであって、前記第1および第2のパラメータセットが、バイナリ算術コード化エンジンの通常モードでエントロピー符号化され、前記第2の変換係数の前記第2のパラメータセット内の少なくともパラメータのコンテキストモデリングが、前記第1の変換係数の復号に依存し、前記第1および第2のパラメータセットが前記ブロックの第1のスキャンパスでエントロピー復号され、前記第1のスキャンパスが、前記ブロックのエントロピー復号変換係数についての1つ以上の他のスキャンパスの前に実行され、前記第1および第2の変換係数についての前記第1および第2のパラメータセットの各セットが、少なくともSIGフラグ、第1のフラグおよび第2のフラグを含み、前記SIGフラグが、対応する変換係数がゼロであるか否かを示し、前記第1のフラグが、前記対応する変換係数の絶対値が1よりも大きいかどうかを示し、前記第2のフラグが、前記対応する変換係数の絶対値が2よりも大きいかどうかを示し、前記第2の変換係数を逆量子化する逆量子化器が、前記第1の変換係数に関連付けられる前記第1のパラメータセットの前記SIGフラグ、前記第1のフラグ、及び前記第2のフラグの和又はXOR関数に基づいて、2つ以上の逆量子化器から選択される、ことと、
前記復号された変換係数に応答して前記ブロックを再構築することと、
を行うように構成されている、装置。
【請求項7】
前記第2の変換係数を逆量子化する逆量子化器が、前記第1の変換係数に基づいて、2つ以上の量子化器から選択される、請求項6に記載の装置。
【請求項8】
前記逆量子化器が、前記第1の変換係数についての前記第1のパラメータセットに基づいて選択される、請求項7に記載の装置。
【請求項9】
前記逆量子化器が、前記第1のフラグ、前記第2のフラグ、または前記第1のパラメータセットの別のフラグに基づいて選択され、前記別のフラグが、前記対応する変換係数の絶対値がxよりも大きいかどうかを示す、請求項7に記載の装置。
【請求項10】
前記SIG、第1、第2のフラグまたは別のフラグのコンテキストモデリングが、前記量子化器または前記量子化器の選択において使用されるステートに基づく、請求項7に記載の装置。
【請求項11】
方法であって、
ピクチャのブロック内の第1の変換係数に関連する第1のパラメータセットにアクセスすることであって、前記第1の変換係数が、符号化順序で前記ピクチャの前記ブロック内の第2の変換係数に先行する、ことと、
前記第2の変換係数に関連する第2のパラメータセットにアクセスすることであって、前記第1および第2のパラメータセットが、バイナリ算術コード化エンジンの通常モードでエントロピー符号化され、前記第2の変換係数の前記第2のパラメータセットの少なくともパラメータのコンテキストモデリングが、前記第1の変換係数の符号化に依存する、ことと、
前記ブロックの第1のスキャンパスにおける前記第1および第3のパラメータセットをエントロピー符号化することであって、前記第1のスキャンパスが、前記ブロックのエントロピー符号化変換係数の1つ以上の他のスキャンパスの前に実行され、前記第1および第2の変換係数についての前記第1および第2のパラメータセットの各セットが、少なくともSIGフラグ、第1のフラグおよび第2のフラグを含み、前記SIGフラグが、対応する変換係数がゼロであるか否かを示し、前記第1のフラグが、前記対応する変換係数の絶対値が1よりも大きいかどうかを示し、前記第2のフラグが、前記対応する変換係数の絶対値が2よりも大きいかどうかを示し、
前記第2の変換係数を量子化する量子化器が、前記第1のパラメータセットの前記SIGフラグ、前記第1のフラグ、及び前記第2のフラグの和又はXOR関数に基づいて、2つ以上の
量子化器から選択される、ことと、
を備える、方法。
【請求項12】
前記第2の変換係数を量子化する
前記量子化器が、前記第1の変換係数に基づいて
選択される、請求項11に記載の方法。
【請求項13】
前記SIG、第1、第2のフラグのコンテキストモデリングが、前記量子化器または前記量子化器の選択において使用されるステートに基づく、請求項11に記載の方法。
【請求項14】
1つ以上のプロセッサを備える装置であって、前記1つ以上のプロセッサが、
ピクチャのブロック内の第1の変換係数に関連する第1のパラメータセットにアクセスすることであって、前記第1の変換係数が、符号化順序で前記ピクチャの前記ブロック内の第2の変換係数に先行する、ことと、
前記第2の変換係数に関連する第2のパラメータセットにアクセスすることであって、前記第1および第2のパラメータセットが、バイナリ算術コード化エンジンの通常モードでエントロピー符号化され、前記第2の変換係数の前記第2のパラメータセットの少なくともパラメータのコンテキストモデリングが、前記第1の変換係数の符号化に依存する、ことと、
前記ブロックの第1のスキャンパスにおける前記第1および第3のパラメータセットをエントロピー符号化することであって、前記第1のスキャンパスが、前記ブロックのエントロピー符号化変換係数の1つ以上の他のスキャンパスの前に実行され、前記第1および第2の変換係数についての前記第1および第2のパラメータセットの各セットが、少なくともSIGフラグ、第1のフラグおよび第2のフラグを含み、前記SIGフラグが、対応する変換係数がゼロであるか否かを示し、前記第1のフラグが、前記対応する変換係数の絶対値が1よりも大きいかどうかを示し、前記第2のフラグが、前記対応する変換係数の絶対値が2よりも大きいかどうかを示し、
前記第2の変換係数を量子化する量子化器が、前記第1のパラメータセットの前記SIGフラグ、前記第1のフラグ、及び前記第2のフラグの和又はXOR関数に基づいて、2つ以上の
量子化器から選択される、ことと
を行うように構成されている、装置。
【請求項15】
前記第2の変換係数を量子化する
前記量子化器が、前記第1の変換係数に基づいて
選択される、請求項14に記載の装置。
【請求項16】
前記SIG、第1、第2のフラグのコンテキストモデリングが、前記量子化器または前記量子化器の選択において使用されるステートに基づく、請求項14に記載の装置。
【発明の詳細な説明】
【技術分野】
【0001】
本実施形態は、一般に、ビデオ符号化または復号のための方法および装置に関する。
【背景技術】
【0002】
高い圧縮効率を達成するために、画像およびビデオの符号化スキームは、通常、予測および変換を用いて、ビデオコンテンツの空間的および時間的冗長性を活用する。一般に、イントラまたはインター予測は、イントラまたはインターピクチャ相関を活用するために使用され、次いで、元のブロックと予測ブロックとの間の差、多くの場合、予測誤差または予測残差と称される差が、変換され、量子化され、エントロピー符号化される。ビデオを再構成するために、圧縮データは、エントロピー符号化、量子化、変換、および予測に対応する逆プロセスによって復号される。
【発明の概要】
【発明が解決しようとする課題】
【0003】
実施形態によれば、ビデオ復号の方法であって、ピクチャのブロック内の第1の変換係数に関連する第1のパラメータセットにアクセスすることであって、前記第1の変換係数が、復号順序で前記ピクチャの前記ブロック内の第2の変換係数に先行することと、前記第2の変換係数に関連する第2のパラメータセットにアクセスすることであって、前記第1および第2のパラメータセットが、通常モードでエントロピー符号化され、前記第2の変換係数の前記第2のパラメータセットの少なくともパラメータのコンテキストモデリングが、前記第1の変換係数の復号に依存することと、前記ブロックの第1のスキャンパスにおける前記第1および第2のパラメータセットをエントロピー復号することであって、前記第1のスキャンパスが、前記ブロックのエントロピー復号変換係数の他のスキャンパスの前に実行され、前記第1および第2の変換係数についての前記第1および第2のパラメータセットの各セットが、gt1フラグおよびgt2フラグのうちの少なくとも1つを含み、前記gt1フラグが、対応する変換係数の絶対値が1よりも大きいかどうかを示し、前記gt2フラグが、前記対応する変換係数の絶対値が2よりも大きいかどうかを示すことと、前記復号された変換係数に応答して前記ブロックを再構築することと、を備える、方法が提供される。
【0004】
実施形態によれば、ビデオ符号化の方法であって、ピクチャのブロック内の第1の変換係数に関連する第1のパラメータセットにアクセスすることであって、前記第1の変換係数が、符号化順序で前記ピクチャの前記ブロック内の第2の変換係数に先行することと、前記第2の変換係数に関連する第2のパラメータセットにアクセスすることであって、前記第1および第2のパラメータセットが、通常モードでエントロピー符号化され、前記第2の変換係数の前記第2のパラメータセットの少なくともパラメータのコンテキストモデリングが、前記第1の変換係数の符号化に依存することと、前記ブロックの第1のスキャンパスにおける前記第1および第2のパラメータセットをエントロピー符号化することであって、前記第1のスキャンパスが、前記ブロックのエントロピー符号化変換係数の他のスキャンパスの前に実行され、前記第1および第2の変換係数についての前記第1および第2のパラメータセットの各セットが、gt1フラグおよびgt2フラグのうちの少なくとも1つを含み、前記gt1フラグが、対応する変換係数の絶対値が1よりも大きいかどうかを示し、前記gt2フラグが、前記対応する変換係数の絶対値が2よりも大きいかどうかを示すことと、を備える、方法が提供される。
【0005】
別の実施形態によれば、1つ以上のプロセッサを備えるビデオ復号のための装置であって、前記1つ以上のプロセッサが、ピクチャのブロック内の第1の変換係数に関連する第1のパラメータセットにアクセスし、前記第1の変換係数が、復号順序で前記ピクチャの前記ブロック内の第2の変換係数に先行し、前記第2の変換係数に関連する第2のパラメータセットにアクセスし、前記第1および第2のパラメータセットが、通常モードでエントロピー符号化され、前記第2の変換係数の前記第2のパラメータセットの少なくともパラメータのコンテキストモデリングが、前記第1の変換係数の復号に依存し、前記ブロックの第1のスキャンパスにおける前記第1および第2のパラメータセットをエントロピー復号し、前記第1のスキャンパスが、前記ブロックのエントロピー復号変換係数の他のスキャンパスの前に実行され、前記第1および第2の変換係数についての前記第1および第2のパラメータセットの各セットが、gt1フラグおよびgt2フラグのうちの少なくとも1つを含み、前記gt1フラグが、対応する変換係数の絶対値が1よりも大きいかどうかを示し、前記gt2フラグが、前記対応する変換係数の絶対値が2よりも大きいかどうかを示し、前記復号された変換係数に応答して前記ブロックを再構築するように構成されている、装置が提供される。装置は、さらに、前記1つ以上のプロセッサに結合された1つ以上のメモリを備えることができる。
【0006】
別の実施形態によれば、1つ以上のプロセッサを備えるビデオ符号化のための装置であって、前記1つ以上のプロセッサが、ピクチャのブロック内の第1の変換係数に関連する第1のパラメータセットにアクセスし、前記第1の変換係数が、符号化順序で前記ピクチャの前記ブロック内の第2の変換係数に先行し、前記第2の変換係数に関連する第2のパラメータセットにアクセスし、前記第1および第2のパラメータセットが、通常モードでエントロピー符号化され、前記第2の変換係数の前記第2のパラメータセットの少なくともパラメータのコンテキストモデリングが、前記第1の変換係数の符号化に依存し、前記ブロックの第1のスキャンパスにおける前記第1および第2のパラメータセットをエントロピー符号化し、前記第1のスキャンパスが、前記ブロックのエントロピー符号化変換係数の他のスキャンパスの前に実行され、前記第1および第2の変換係数についての前記第1および第2のパラメータセットの各セットが、gt1フラグおよびgt2フラグのうちの少なくとも1つを含み、前記gt1フラグが、対応する変換係数の絶対値が1よりも大きいかどうかを示し、前記gt2フラグが、前記対応する変換係数の絶対値が2よりも大きいかどうかを示すように構成されている、装置が提供される。
【0007】
別の実施形態によれば、ビデオ復号の装置であって、ピクチャのブロック内の第1の変換係数に関連する第1のパラメータセットにアクセスする手段であって、前記第1の変換係数が、復号順序で前記ピクチャの前記ブロック内の第2の変換係数に先行する手段と、前記第2の変換係数に関連する第2のパラメータセットにアクセスする手段であって、前記第1および第2のパラメータセットが、通常モードでエントロピー符号化され、前記第2の変換係数の前記第2のパラメータセットの少なくともパラメータのコンテキストモデリングが、前記第1の変換係数の復号に依存する手段と、前記ブロックの第1のスキャンパスにおける前記第1および第2のパラメータセットをエントロピー復号する手段であって、前記第1のスキャンパスが、前記ブロックのエントロピー復号変換係数の他のスキャンパスの前に実行され、前記第1および第2の変換係数についての前記第1および第2のパラメータセットの各セットが、gt1フラグおよびgt2フラグのうちの少なくとも1つを含み、前記gt1フラグが、対応する変換係数の絶対値が1よりも大きいかどうかを示し、前記gt2フラグが、前記対応する変換係数の絶対値が2よりも大きいかどうかを示す手段と、前記復号された変換係数に応答して前記ブロックを再構築する手段と、を備える、装置が提供される。
【0008】
別の実施形態によれば、ビデオ符号化の装置であって、ピクチャのブロック内の第1の変換係数に関連する第1のパラメータセットにアクセスする手段であって、前記第1の変換係数が、符号化順序で前記ピクチャの前記ブロック内の第2の変換係数に先行する手段と、前記第2の変換係数に関連する第2のパラメータセットにアクセスする手段であって、前記第1および第2のパラメータセットが、通常モードでエントロピー符号化され、前記第2の変換係数の前記第2のパラメータセットの少なくともパラメータのコンテキストモデリングが、前記第1の変換係数の符号化に依存する手段と、前記ブロックの第1のスキャンパスにおける前記第1および第2のパラメータセットをエントロピー符号化する手段であって、前記第1のスキャンパスが、前記ブロックのエントロピー符号化変換係数の他のスキャンパスの前に実行され、前記第1および第2の変換係数についての前記第1および第2のパラメータセットの各セットが、gt1フラグおよびgt2フラグのうちの少なくとも1つを含み、前記gt1フラグが、対応する変換係数の絶対値が1よりも大きいかどうかを示し、前記gt2フラグが、前記対応する変換係数の絶対値が2よりも大きいかどうかを示す手段と、を備える、装置が提供される。
【0009】
別の実施形態によれば、符号化されたビデオを含む信号であって、ピクチャのブロック内の第1の変換係数に関連する第1のパラメータセットにアクセスすることであって、前記第1の変換係数が、符号化順序で前記ピクチャの前記ブロック内の第2の変換係数に先行することと、前記第2の変換係数に関連する第2のパラメータセットにアクセスすることであって、前記第1および第2のパラメータセットが、通常モードでエントロピー符号化され、前記第2の変換係数の前記第2のパラメータセットの少なくともパラメータのコンテキストモデリングが、前記第1の変換係数の符号化に依存することと、前記ブロックの第1のスキャンパスにおける前記第1および第2のパラメータセットをエントロピー符号化することであって、前記第1のスキャンパスが、前記ブロックのエントロピー符号化変換係数の他のスキャンパスの前に実行され、前記第1および第2の変換係数についての前記第1および第2のパラメータセットの各セットが、gt1フラグおよびgt2フラグのうちの少なくとも1つを含み、前記gt1フラグが、対応する変換係数の絶対値が1よりも大きいかどうかを示し、前記gt2フラグが、前記対応する変換係数の絶対値が2よりも大きいかどうかを示すことと、を実行することにより、信号が形成される。
【図面の簡単な説明】
【0010】
【
図1】
図1は、本実施形態の態様が実装されることができる、システムのブロック図を示している。
【
図2】
図2は、ビデオ符号化器の実施形態のブロック図を示している。
【
図3】
図3は、ビデオ復号器の実施形態のブロック図を示している。
【
図4】
図4は、JVET-J0014において提案された従属量子化で使用される2つのスカラー量子化器を示す図の例である。
【
図5】
図5は、JVET-J0014において提案された従属量子化のための状態遷移および量子化器選択を示す図の例である。
【
図6】
図6は、JVET-J0014において提案された、CGにおける係数ビンの順序を示す図の例である。
【
図7】
図7は、JVET-K0319において提案された、SIGベースの状態遷移を示す図の例である。
【
図8】
図8は、JVET-K0319において提案された、CGにおける係数ビンの順序を示す図の例である。
【
図9】
図9は、一実施形態にかかる、CGにおける係数ビンの順序を示す図の例である。
【
図10】
図10は、一実施形態にかかる、SUM(SIG,gt1,gt2)ベースの状態遷移を示す図の例である。
【
図11】
図11は、一実施形態にかかる、XOR(SIG、gt1、gt2)ベースの状態遷移を示す図の例である。
【
図12】
図12は、一実施形態にかかる、gt1ベースの状態遷移を示す図の例である。
【
図13】
図13は、一実施形態にかかる、現在ブロックを符号化するプロセスを示している。
【
図14】
図14は、一実施形態にかかる、現在ブロックを復号するプロセスを示している。
【発明を実施するための形態】
【0011】
図1は、様々な態様および実施形態が実装されることができるシステムの例のブロック図を示している。システム100は、以下で説明される様々な構成要素を含む装置として具体化されることができ、本出願で説明される態様の1つ以上を実行するように構成される。そのような装置の例は、これらに限定されるものではないが、パーソナルコンピュータ、ラップトップコンピュータ、スマートフォン、タブレットコンピュータ、デジタルマルチメディアセットトップボックス、デジタルテレビ受像機、パーソナルビデオ録画システム、コネクテッド家電、およびサーバなどの様々な電子装置を含む。システム100の要素は、単独でも組み合わせでも、単一の集積回路、複数のIC、および/または別個の構成要素に具体化されることができる。例えば、少なくとも1つの実施形態において、システム100の処理および符号化器/復号器要素は、複数のICおよび/または別個の構成要素にわたって分散している。様々な実施形態において、システム100は、他のシステムに、または他の電子装置に、例えば、通信バスを介して、または専用の入力および/または出力ポートを介して、通信可能に結合される。様々な実施形態において、システム100は、本出願に記載の態様のうちの1つ以上を実装するように構成される。
【0012】
システム100は、例えば本出願に記載の様々な態様を実装するために、そこにロードされる命令を実行するように構成された少なくとも1つのプロセッサ110を含む。プロセッサ110は、埋め込みメモリ、入力出力インターフェース、および当該技術分野において知られているような他の様々な回路を含むことができる。システム100は、少なくとも1つのメモリ120(例えば、揮発性メモリ装置、および/または不揮発性メモリ装置)を含む。システム100は、これらに限定されるものではないが、EEPROM、ROM、PROM、RAM、DRAM、SRAM、フラッシュ、磁気ディスクドライブ、および/または光ディスクドライブを含む、不揮発性メモリおよび/または揮発性メモリを含むことができる記憶装置140を含む。記憶装置140は、非限定的な例として、内部記憶装置、着脱可能記憶装置、および/またはネットワークアクセス可能記憶装置を含むことができる。
【0013】
システム100は、例えば、符号化されたビデオまたは復号されたビデオを提供するようにデータを処理するように構成された符号化器/復号器モジュール130を含み、符号化器/復号器モジュール130は、独自のプロセッサおよびメモリを含むことができる。符号化器/復号器モジュール130は、符号化および/または復号機能を実行する装置に含まれることができるモジュール(複数可)を表す。公知であるように、装置は、符号化モジュールおよび復号モジュールの一方または双方を含むことができる。さらに、符号化器/復号器モジュール130は、システム100の別個の要素として実装されてもよく、または、当業者にとって公知のハードウェアとソフトウェアとの組み合わせとしてプロセッサ110内に組み込まれてもよい。
【0014】
本出願に記載の態様を実行するようにプロセッサ110または符号化器/復号器130にロードされることになるプログラムコードは、記憶装置140に記憶され、続いて、プロセッサ110による実行のためにメモリ120上にロードされることができる。様々な実施形態によれば、プロセッサ110、メモリ120、記憶装置140、および符号化器/復号器モジュール130のうちの1つ以上は、本出願に記載のプロセスの実行中、様々な項目のうちの1つ以上を記憶することができる。そのような記憶される項目は、これらに限定されるものではないが、入力ビデオ、復号されたビデオまたは復号されたビデオの一部、ビットストリーム、行列、変数、ならびに方程式、式、演算、および演算ロジックの処理からの中間結果または最終結果を含むことができる。
【0015】
いくつかの実施形態において、プロセッサ110および/または符号化器/復号器モジュール130の内部のメモリを使用して、命令を記憶し、符号化中または復号中に必要とされる処理のためにワーキングメモリを提供する。しかしながら、他の実施形態において、処理装置(例えば、処理装置は、プロセッサ110または符号化器/復号器モジュール130のいずれかとすることができる)の外部のメモリは、これらの機能のうちの1つ以上のために使用される。外部メモリは、メモリ120および/または記憶装置140とすることができ、例えば、ダイナミック揮発性メモリおよび/または不揮発性フラッシュメモリとすることができる。いくつかの実施形態において、テレビのオペレーティングシステムを記憶するために外部不揮発性フラッシュメモリが使用される。少なくとも1つの実施形態において、MPEG-2、HEVC、またはVVCなど、ビデオ符号化および復号動作のために、RAMなどの高速外部ダイナミック揮発性メモリがワーキングメモリとして使用される。
【0016】
システム100の要素への入力は、ブロック105に示されるような様々な入力装置を介して提供されることができる。そのような入力装置には、これらに限定されるものではないが、(i)例えば、ブロードキャスタによって無線を介して送信されたRF信号を受信するRF部、(ii)コンポジット入力端子、(iii)USB入力端子、および/または(iv)HDMI入力端子を含む。
【0017】
様々な実施形態において、ブロック105の入力装置は、当該技術分野において知られているような関連するそれぞれの入力処理要素を有する。例えば、RF部は、(i)所望の周波数を選択する(信号を選択する、またはある周波数帯域に信号を帯域制限する、とも称される)こと、(ii)選択された信号をダウンコンバートすること、(iii)(例えば)ある特定の実施形態ではチャネルと称される場合がある信号周波数帯域を選択するように、より狭い周波数帯域に再び帯域制限すること、(iv)ダウンコンバートされて帯域制限された信号を復調すること、(v)誤り訂正を実行すること、および(vi)逆多重化して所望のデータパケットストリームを選択することに対して好適な要素に関連付けられることができる。様々な実施形態のRF部は、これらの機能を実行する1つ以上の要素、例えば、周波数セレクタ、信号セレクタ、帯域リミッタ、チャネルセレクタ、フィルタ、ダウンコンバータ、復調器、誤り訂正器、およびデマルチプレクサを含む。RF部は、例えば、受信された信号をより低い周波数に(例えば、中間周波数またはベースバンドに近い周波数)、またはベースバンドにダウンコンバートすることを含む、様々なこれらの機能を実行するチューナを含むことができる。1つのセットトップボックスの実施形態において、RF部およびその関連付けられた入力処理要素は、有線(例えば、ケーブル)媒体経由で送信されたRF信号を受信し、フィルタリングし、ダウンコンバートし、所望の周波数帯域に再びフィルタリングすることによって、周波数選択を実行する。様々な実施形態は、上記(および他の)要素の順序を並べ替え、これらの要素のうちのいくつかを取り除き、および/または同様もしくは異なる機能を実行する他の要素を追加する。要素を追加することは、既存の要素間に要素を挿入すること、例えば、増幅器およびアナログ-デジタル変換器を挿入することを含むことができる。様々な実施形態において、RF部は、アンテナを含む。
【0018】
さらに、USBおよび/またはHDMI端子は、USBおよび/またはHDMI接続にわたって他の電子装置にシステム100を接続するためのそれぞれのインターフェースプロセッサを含むことができる。入力処理の様々な態様、例えばリード・ソロモン誤り訂正が、例えば、必要に応じて、別個の入力処理IC内またはプロセッサ110内で実装されることができることを理解されたい。同様に、USBまたはHDMIインターフェース処理の態様は、必要に応じて、別個のインターフェースIC内またはプロセッサ110内で実装されることができる。復調され、誤り訂正され、かつ多重分離されたストリームは、例えば、プロセッサ110と、出力装置上での表示のために、必要に応じてデータストリームを処理するようにメモリおよび記憶要素と組み合わせて動作する符号化器/復号器130と、を含む様々な処理要素に提供される。
【0019】
システム100の様々な要素は、一体型ハウジング内に提供されることができ、一体型ハウジング内では、様々な要素が相互接続され、好適な接続配置115、例えば、I2Cバス、配線、およびプリント回路基板を含む、当該技術分野において知られているような内部バスを使用して、それらの間でデータを送信することができる。
【0020】
システム100は、通信チャネル190を介して他の装置との通信を可能にする通信インターフェース150を含む。通信インターフェース150は、これに限定されるものではないが、通信チャネル190経由でデータを送受信するように構成されたトランシーバを含むことができる。通信インターフェース150は、これらに限定されるものではないが、モデムまたはネットワークカードを含むことができ、通信チャネル190は、例えば、有線および/または無線媒体内に実装されることができる。
【0021】
様々な実施形態において、データは、IEEE802.11などのWi-Fiネットワークを使用して、システム100にストリーミングされる。これらの実施形態のWi-Fi信号は、Wi-Fi通信に適合された通信チャネル190および通信インターフェース150経由で受信される。これらの実施形態の通信チャネル190は、通常、アプリケーションをストリーミングすることおよび他のオーバー・ザ・トップ通信を可能にするためにインターネットを含む外部ネットワークへのアクセスを提供するアクセスポイントまたはルータに接続される。他の実施形態は、入力ブロック105のHDMI接続経由でデータを配信するセットトップボックスを使用して、ストリーミングされたデータをシステム100に提供する。さらに他の実施形態は、入力ブロック105のRF接続を使用して、ストリーミングされたデータをシステム100に提供する。
【0022】
システム100は、ディスプレイ165、スピーカ175、および他の周辺装置185を含む、様々な出力装置に出力信号を提供することができる。他の周辺装置185は、実施形態の様々な例において、スタンドアローンDVR、ディスクプレーヤ、ステレオシステム、照明システム、およびシステム100の出力に基づいて機能を提供する他の装置のうちの1つ以上を含む。様々な実施形態において、システム100と、ディスプレイ165、スピーカ175、または他の周辺装置185との間で、AVリンク、CEC、またはユーザの介入の有無に関わらず、デバイス・ツー・デバイス制御を可能にする他の通信プロトコルなどのシグナリングを使用して、制御信号が伝送される。出力装置は、それぞれのインターフェース160、170、および180による専用接続を介してシステム100に通信可能に結合されることができる。あるいは、出力装置は、通信インターフェース150を介して、通信チャネル190を使用してシステム100に接続されることができる。ディスプレイ165およびスピーカ175は、例えば、テレビなどの電子装置内のシステム100の他の構成要素と、単一のユニットにおいて一体化されることができる。様々な実施形態において、ディスプレイインターフェース160は、ディスプレイドライバ、例えば、タイミングコントローラ(T Con)チップを含む。
【0023】
ディスプレイ165およびスピーカ175は、例えば、入力105のRF部が別個のセットトップボックスの一部である場合、他の構成要素のうちの1つ以上から代替的に分離されることができる。ディスプレイ165およびスピーカ175が外部構成要素である様々な実施形態において、例えば、HDMIポート、USBポート、またはコンポジット(COMP)出力を含む、専用出力接続を介して出力信号が提供されることができる。
【0024】
図2は、高効率ビデオ符号化(HEVC)符号化器などのビデオ符号化器200の例を示している。
図2はまた、JVET(Joint Video Exploration Team)によって開発中のVVC(バーサタイルビデオ符号化)符号化器などの、HEVC規格を改良した符号化器またはHEVCに類似した技術を採用した符号化器を示すことができる。
【0025】
本出願では、「再構築された(reconstructed)」および「復号された(decoded)」という用語は、互換的に使用されることができ、「符号化された(encoded)」または「コード化された(coded)」という用語は、互換的に使用されることができ、「画像(image)」、「ピクチャ(picture)および「フレーム(frame)」という用語は、互換的に使用されることができる。必須ではないが、通常は、「再構築された」という用語は、符号化器側において使用される一方で「復号された」は、復号器側において使用される。
【0026】
符号化される前に、ビデオシーケンスは、事前符号化処理(201)、例えば、入力色ピクチャへの色変換(例えば、RGB 4:4:4からYCbCr 4:2:0への変換)を適用すること、または、(例えば、色成分のうちの1つのヒストグラム等化を使用して)圧縮に対してより復元力のある信号分布を得るために、入力ピクチャ成分の再マッピングを実行することを経ることができる。メタデータは、事前処理に関連付けられることができ、ビットストリームに添付されることができる。
【0027】
1つ以上のピクチャでビデオシーケンスを符号化するために、ピクチャは、各スライスが1つ以上のスライスセグメントを含むことができる1つ以上のスライスに分割される(202)。HEVCでは、スライスセグメントは、符号化ユニットと、予測ユニットと、変換ユニットと、に編成される。HEVC仕様は、「ブロック」と「ユニット」とを区別し、ここで「ブロック」は、サンプルアレイの特定の領域(例えば、輝度、Y)をアドレス指定し、「ユニット」は、全ての符号化された色成分(Y、Cb、Cr、またはモノクロ)、構文要素、およびブロックに関連付けられている予測データ(例えば、動きベクトル)の配列されたブロックを含む。
【0028】
HEVCでのコード化では、ピクチャは、構成可能サイズ(通常、64×64、128×128、または256×256ピクセル)を有する正方形のコード化ツリーブロック(CTB)に分割され、コード化ツリーブロックの連続したセットは、スライスにグループ化される。コード化ツリーユニット(CTU)は、符号化された色成分のCTBを包含する。CTBは、コード化ブロック(CB)への四分木分割のルートであり、コード化ブロックは、1つ以上の予測ブロック(PB)に分割されることができ、変換ブロック(TB)への四分木分割のルートを形成する。4×4よりも大きい変換ブロック(TB)は、係数グループ(CG)と呼ばれる量子化係数の4×4サブブロックに分割される。コード化ブロック、予測ブロック、および変換ブロックに対応して、コード化ユニット(CU)は、予測ユニット(PU)と、変換ユニット(TU)のツリー構造セットと、を含み、PUは、全ての色成分についての予測情報を含み、TUは、各色成分の残差コード化構文構造を含む。輝度成分のCB、PB、およびTBのサイズは、対応するCU、PU、およびTUに適用される。本出願では、「ブロック」という用語は、例えば、CTU、CU、PU、TU、CG、CB、PB、およびTBのいずれかを指すために使用されることができる。さらに、「ブロック」は、H.264/AVCまたは他のビデオコード化規格において規定されているマクロブロックおよびパーティションを指すためにも使用されることができ、より一般的には、様々なサイズのデータのアレイを指すために使用されることができる。
【0029】
符号化器200では、以下に説明されているように、ピクチャが、符号化器要素によって符号化される。符号化されるピクチャは、例えば、CUの単位で処理される。各コード化ユニットは、イントラモードまたはインターモードのいずれかを使用して符号化される。コード化ユニットがイントラモードで符号化されるとき、イントラ予測を実行する(260)。インターモードにおいて、動き推定(275)および動き補償(270)が行われる。符号化器は、イントラモードまたはインターモードのいずれをコード化ユニットの符号化に使用するかを決定し(205)、予測モードフラグによってイントラ/インター決定を示す。予測残差は、元の画像ブロックから予測ブロックを減算することによって計算される(210)。
【0030】
次いで、予測残差が変換され(225)、量子化される(230)。量子化された変換係数に加えて、動きベクトルおよび他の構文要素は、ビットストリームを出力するためにエントロピー符号化される(245)。非限定的な例として、コンテキストベースの適応バイナリ算術コード化(CABAC)を使用して、構文要素をビットストリームに符号化することができる。
【0031】
CABACで符号化するために、非バイナリ構文要素の値は、2値化プロセスを介して、ビンストリングと呼ばれるバイナリシーケンスにマッピングされる。ビンの場合、コンテキストモデルが選択される。「コンテキストモデル」は、1つ以上のビンの確率モデルであり、最近コード化されたシンボルの統計に応じて、利用可能なモデルの選択から選択される。各ビンのコンテキストモデルは、コンテキストモデルインデックス(「コンテキストインデックス」とも呼ばれる)によって識別され、異なるコンテキストインデックスが異なるコンテキストモデルに対応する。コンテキストモデルは、各ビンが「1」または「0」である確率を記憶し、適応型または静的型とすることができる。静的モデルは、ビン「0」および「1」に対して等しい確率でコード化エンジンをトリガする。適応コード化エンジンでは、ビンの実際のコード化値に基づいてコンテキストモデルが更新される。適応モデルおよび静的モデルに対応する動作モードは、それぞれ、通常モードおよびバイパスモードと呼ばれる。コンテキストに基づいて、バイナリ算術コード化エンジンは、対応する確率モデルにしたがってビンを符号化または復号する。
【0032】
スキャンパターンは、2次元ブロックを1次元配列に変換し、サンプルまたは係数の処理順序を定義する。スキャンパスは、特定の構文要素をコード化するために、(選択されたスキャンパターンにしたがった)ブロック内の変換係数にわたる反復である。
【0033】
HEVCでは、TBにわたるスキャンパスは、次に、スキャンパターン(対角、水平、垂直)にしたがって各CGを順番に処理することで構成され、各CG内の16個の係数は、同様に考慮されたスキャン順序にしたがってスキャンされる。スキャンは、TBの最後の有意係数から開始し、DC係数まで全ての係数を処理する。CGは、順次スキャンされる。最大5つのスキャンパスがCGに適用される。各スキャンパスは、以下のようにCG内の係数の構文要素をコード化する:
・有意係数フラグ(SIG、significant_coeff_flag):係数の有意性(ゼロ/非ゼロ)。
・1よりも大きい係数絶対レベルフラグ(gt1、coeff_abs_level_greater1_flag):係数レベルの絶対値が1よりも大きいかどうかを示す。
・2つのフラグよりも大きい係数絶対レベル(gt2、coeff_abs_level_greater2_flag):係数レベルの絶対値が2よりも大きいかどうかを示す。
・係数符号フラグ(coeff_sign_flag):有意係数の符号(0:正、1:負)。
・係数の残りの絶対レベル(coeff_abs_level_remaining):係数レベルの絶対値の残りの値(値が前のパスにおいてコード化された値よりも大きい場合)。特定のCGには、最大8つのcoeff_abs_level_greater1_flagがコード化されることができ、coeff_abs_level_greater2_flagは、大きさが1よりも大きいCGの第1の係数に対してのみコード化される。
【0034】
各スキャンパスでは、前のスキャンパスで決定された必要な場合にのみ構文がコード化される。例えば、係数が有意でない場合、残りのスキャンパスは、その係数に必要ない。最初の3つのスキャンパスのビンは、通常モードでコード化され、コンテキストモデルインデックスは、TB内の特定の係数の位置と、ローカルテンプレートによってカバーされる近傍の以前にコード化された係数の値とに依存する。スキャンパス4および5のビンは、CG内の全てのバイパスビンがグループ化されるように、バイパスモードでコード化される。
【0035】
符号化器はまた、変換をスキップし、4×4TUベースで非変換残差信号に直接量子化を適用することができる。符号化器はまた、変換および量子化の双方をバイパスすることもでき、すなわち、残差は、変換または量子化プロセスを適用せずに直接コード化される。直接PCMコード化では、予測は適用されず、コード化ユニットサンプルは、ビットストリームに直接コード化される。
【0036】
符号化器は、符号化されたブロックを復号して、さらに予測するための参照を提供する。量子化された変換係数は、逆量子化され(240)、逆変換され(250)、予測残差を復号する。復号された予測残差と予測ブロックとを組み合わせて(255)、画像ブロックが再構築される。インループフィルタ(265)は、再構築されたピクチャに適用され、例えば、デブロッキング/SAO(サンプル適合オフセット)フィルタリングを実行し、符号化アーティファクトを低減する。フィルタリングされた画像は、参照ピクチャバッファ(280)に記憶される。
【0037】
図3は、HEVC復号器などのビデオ復号器300の例のブロック図を示している。復号器300では、以下に説明されているように、ビットストリームが、復号器要素によって復号される。ビデオ復号器300は、一般に、
図2で説明されたような符号化パスの逆の復号パスを実行し、これは、ビデオデータの符号化の一部として、ビデオ復号を実行する。
図3はまた、VVC復号器などのHEVC規格を改良した復号器またはHEVCに類似した技術を採用した復号器を示すことができる。
【0038】
特に、復号器の入力は、ビデオ符号化器200によって生成されることができるビデオビットストリームを含む。ビットストリームは、まずエントロピー復号され(330)、変換係数、動きベクトル、ピクチャパーティショニング情報、および他のコード化された情報を取得する。エントロピー符号化にCABACが使用される場合、コンテキストモデルは、符号化器コンテキストモデルと同じ方法で初期化され、構文要素は、コンテキストモデルに基づいてビットストリームから復号される。
【0039】
ピクチャパーティショニング情報は、ピクチャが分割される方法、例えばCTUのサイズ、およびCTUがCUに、および適用可能な場合はPUにできる限り分割される方法を示す。したがって、復号器は、復号されたピクチャパーティショニング情報にしたがって、例えば、ピクチャをCTUに分割(335)し、各CTUをCUに分割することができる。変換係数は、逆量子化され(340)、逆変換され(350)、予測残差を復号する。
【0040】
復号された予測残差と予測ブロックとを組み合わせて(355)、画像ブロックが再構築される。予測ブロックは、イントラ予測(360)または動き補償予測(すなわち、インター予測)(375)から取得されることができる(370)。インループフィルタ(365)が再構築された画像に適用される。フィルタリングされた画像は、参照ピクチャバッファ(380)に記憶される。
【0041】
復号されたピクチャは、事後復号処理(385)、例えば、逆色変換(例えば、YCbCr 4:2:0からRGB 4:4:4への変換)または事前符号化処理(201)で行われる再マッピングプロセスの逆を実行する逆再マッピングをさらに経ることができる。事後復号処理は、事前符号化処理において導出されかつビットストリームで信号通知された、メタデータを使用することができる。
【0042】
従属スカラー量子化は、「Description of SDR,HDR and 360° video coding technology proposal by Fraunhofer HHI」、Document JVET-J0014、第10回ミーティング:米国サンディエゴ、2018年4月10日-20日(以下、「JVET-J0014」)と題された記事で提案され、異なる再構築レベルを有する2つのスカラー量子化器が量子化のために切り替えられる。従来の独立スカラー量子化(HEVCおよびVTM-1において使用される)と比較して、変換係数の許容可能な再構築値のセットは、再構築順序で現在の変換係数レベルに先行する変換係数レベルの値に依存する。
【0043】
従属スカラー量子化のアプローチは、(a)異なる再構築レベルによって2つのスカラー量子化器を定義し、(b)2つのスカラー量子化器を切り替えるプロセスを定義することによって実現される。
【0044】
Q0およびQ1によって示される、使用される2つのスカラー量子化器は、
図4に示されている。利用可能な再構築レベルの位置は、量子化ステップサイズΔによって一意に指定される。変換係数の実際の再構築が整数演算を使用するという事実を無視すると、2つのスカラー量子化器Q0およびQ1は、以下のように特徴付けられる:
Q0:第1の量子化器Q0の再構築レベルは、量子化ステップサイズΔの偶数の整数倍によって与えられる。この量子化器が使用されると、再構築された変換係数t’は、以下にしたがって計算される。
t’=2・k・Δ、
ここで、kは、関連する変換係数レベルを示す。「変換係数レベル」(k)という用語は、量子化された変換係数値を指し、例えば、それは、以下のresidual_coding構文構造で説明されるようにTransCoeffLevelに対応することに留意されたい。「再構築された変換係数」(t’)という用語は、逆量子化された変換係数値を指す。
Q1:第2の量子化器Q1の再構築レベルは、量子化ステップサイズΔの奇数の整数倍によって与えられ、さらに、再構築レベルはゼロに等しい。再構築された変換係数t’への変換係数レベルkのマッピングは、以下によって指定される。
t’=(2・k-sgn(k))・Δ、
ここで、sgn(・)は、符号関数を示し、sgn(x)=(k==0?0:(k<0?-1:1))である。
【0045】
使用されるスカラー量子化器(Q0またはQ1)は、ビットストリームで明示的にシグナリングされない。代わりに、現在の変換係数に使用される量子化器は、コード化/再構築の順序で現在の変換係数に先行する変換係数レベルのパリティによって決定される。
【0046】
図5に示されるように、2つのスカラー量子化器(Q0およびQ1)間の切り替えは、4つの状態を有するステートマシンを介して実行される。ステートは、0、1、2、3の4つの異なる値を取ることができる。ステートは、コード化/再構築の順序で現在の変換係数に先行する変換係数レベルのパリティによって一意に決定される。変換ブロックの逆量子化の開始時に、ステートは0に設定される。変換係数は、スキャン順序で(すなわち、エントロピー符号化/復号されるのと同じ順序で)再構築される。現在の変換係数が再構築された後、ステートは、表1に示すように更新され、ここで、kは、変換係数レベルの値を示す。次のステートは、現在のステートと現在の変換係数レベルkのパリティ(k&1)にのみ依存することに留意されたい。kが現在の変換係数レベルの値を表す場合、ステートの更新は、以下のように記述されることができる。
ステート=stateTransTable[ステート][k&1]、
ここで、stateTransTableは、
図5および表1に示される表を表し、演算子&は、2の補数演算におけるビット単位の「and」演算子を指定する。
【0047】
ステートは、使用されるスカラー量子化器を一意に指定する。現在の変換係数についてのステートが0または1に等しい場合、スカラー量子化器Q0が使用される。それ以外の場合(ステートは2または3に等しい)、スカラー量子化器Q1が使用される。
【表1】
【0048】
より一般的には、変換係数の量子化器は、3つ以上のスカラー量子化器から選択されることができ、ステートマシンは、5つ以上のステートを有することができる。または、量子化器の切り替えは、他の可能なメカニズムを介して処理されることができる。
【0049】
従属スカラー量子化と組み合わせた係数コード化スキームもまた、JVET-J0014において提案され、これにより、量子化係数のコンテキストモデリングは、使用した量子化器に依存する。具体的には、有意フラグ(SIG)および1よりも大きいフラグ(gt1)のそれぞれは、2つのセットのコンテキストモデルを有し、特定のSIGまたはgt1に対して選択されるセットは、関連する係数に使用される量子化器に依存する。したがって、JVET-J0014において提案された係数コード化は、量子化器、したがって次の係数についてのコンテキストセットを決定するために使用されるパリティを知るために、次のスキャン位置に移動する前に、量子化係数の絶対レベル(absLevel)を完全に再構築する必要がある。すなわち、係数(n+1)をエントロピー復号するためのコンテキストモデルを取得するために、係数n(SIG、gt1、・・・、gt4、符号フラグ、絶対残存レベル)のエントロピー復号を完了する必要がある。その結果、係数(n+1)のいくつかの通常のコード化ビンは、係数nのいくつかのバイパスコード化ビンの復号を待つ必要があり、したがって、異なる係数のバイパスコード化ビンは、
図6に示されるように通常のコード化ビンとインターリーブされる。
【0050】
図6に示されるように、JVET-J0014における係数コード化の設計は、以下に説明するように、HEVCまたはVTM-1の設計と比較してスループットを低下させる可能性がある:
1.通常のコード化ビンが増加する。通常のコード化ビンは、コンテキストの選択と間隔の細分割の計算により、バイパスされたコード化ビンよりも処理が遅くなる。JVET-J0014の係数コード化では、係数グループ(CG)の通常のコード化ビンの数は、VTM-1(SIGの場合は16、gt1の場合は8、gt2の場合は1)の25と比較して最大80である。
2.バイパスコード化ビンはグループ化されない。バイパスビンをより長いチェーンにグループ化すると、サイクルごとに処理されるビンの数が増えるため、単一のバイパスビンを処理するために必要なサイクル数が減少する。しかしながら、JVET-J0014の係数コード化では、CGのバイパスコード化ビンは、グループ化されず、代わりに、それらは、係数ごとに通常のコード化ビンでインターリーブされる。
【0051】
本出願は、HEVCおよびVTM-1の係数コード化設計として、ほぼ同じレベルのスループットを達成するとともに、従属スカラー量子化によって提供されるゲインのほとんどを維持するためのスカラー量子化器の決定スキームを対象としている。
【0052】
寄書JVET-K0319(「CE7-Related:TCQ with High Throughput Coefficient Coding」、Document JVET-K0319,JVET 第11回ミーティング:スロベニア、リュブリャナ、2018年7月10日-18日、以下「JVET-K0319」を参照)において、JVET-J0014において提案されたパリティベースのステート遷移は、
図7および表2に示されるようにSIGベースのステート遷移に置き換えられるとともに、JVET-J0014における他の依存スカラー量子化設計は、変更されないままである。これを行うことにより、現在の変換係数を量子化するために使用されるスカラー量子化器は、スキャン順序で現在の変換係数に先行する量子化係数のSIGによって決定される。
【表2】
【0053】
JVET-K0319において提案された係数コード化は、HEVCおよびVTM-1係数コード化に基づいている。相違は、SIGおよびgt1のそれぞれが2つのセットのコンテキストモデルを有し、エントロピー符号化器が、関連する係数によって使用される量子化器にしたがって、特定のSIGまたはgt1のコンテキストセットを選択するということである。したがって、従属スカラー量子化のスカラー量子化器をパリティベースからSIGベースに変更すると、HEVCおよびVTM-1係数コード化と同様の高スループット設計が可能になる。CGにおける係数ビンの提案された順序が
図8に示されている。すなわち、JVET-K0319において提案された係数コード化では、通常のコード化ビンは、CGごとに最大25であり、これは、HEVCおよびVTM-1係数コード化と同じままであり、CG内の全てのバイパスコード化ビンは、ともにグループ化される。
【0054】
JVET-J0014における従属量子化のアプローチは、CE7のテスト7.2.1ソフトウェアでテストされ、シミュレーション結果は、VTM-1.0アンカーと比較して、4.99%AI(全てのイントラ)、3.40%RA(ランダムアクセス)、および2.70%LDB(低遅延B)のBDレート低下を示している。しかしながら、JVET-K0319のシミュレーション結果は、VTM-1.0アンカーと比較して、3.98%AI、2.58%RA、および1.80%LDBのBDレート低下を示している。すなわち、変換係数をJVET-K0319(SIGのみに基づくスイッチング)として量子化するために使用されるスカラー量子化器は、JVET-J0014(量子化係数の完全なabsLevelに基づくスイッチング)において提案されたものと比較して、コード化効率を低下させる可能性がある。
【0055】
本出願は、高スループットとコード化効率との間の適切なトレードオフを達成するために、従属スカラー量子化に使用されるスカラー量子化器のいくつかの代替決定スキームを提案する。絶対レベルまたはSIG値のパリティを使用する代わりに、ステート遷移と、通常のコード化ビンに基づくコンテキストモデルの選択が提案される。以下では、従属スカラー量子化に使用されるスカラー量子化器を決定するいくつかの実施形態について説明する。
【0056】
JVET-J0014において提案された従属スカラー量子化の場合、次の係数についての量子化器を決定するために使用されるパリティを知るために、次のスキャン位置に移動する前に、量子化係数の絶対レベル(absLevel)を完全に再構築する必要がある。したがって、CG内のバイパスコード化ビンは、グループ化されず、それらは、係数ごとに通常のコード化ビンとインターリーブされる。さらに、以下の構文表に示されるように、HEVCおよびVTM-1とは対照的に、変換係数レベルごとの通常のコード化ビンの最大数が増加する(JVET-J0014において提案されたアプローチでは、変換係数レベルごとに最大5つの通常のコード化ビンが発生する可能性がある)。VTM-1に対する変更は、斜体で示している。エントロピー符号化器は、変換係数レベルの情報に依存しかつ量子化器を決定するために使用される「ステート」にしたがって、特定のSIGまたはgt1のコンテキストセットを選択する。ビンのコード化順序は、次の構文で示されており、ここで、関数getSigCtxId(xC,yC,ステート)は、現在の係数スキャン位置(xC,yC)とステートとに基づいて、構文sig_coeff_flagのコンテキストを導出するために使用され、decodeSigCoeffFlag(sigCtxId)は、関連するコンテキストsigCtxIdとともに構文sig_coeff_flagを復号するためのものであり、getGreater1CtxId(xC,yC,ステート)は、現在の係数スキャン位置(xC,yC)とステートとに基づいて構文abs_level_gt1_flagのコンテキストを導出するために使用され、decodeAbsLevelGt1Flag(greater1CtxId)は、関連するコンテキストgreater1CtxIdとともに構文abs_level_gt1_flagを復号するためのものである。
【表3】
【0057】
前に説明したように、これらの構文の変更のために、高スループットのハードウェア実装に関して潜在的な問題がある。我々の提案では、従属スカラー量子化をサポートしながら、HEVCとほぼ同じレベルのスループットを達成するための代替アプローチが提案される。以下では、HEVCを例として使用して、提案された変更を説明する。
【0058】
一実施形態では、変換係数レベルごとの通常のコード化ビンの最大数は、5ではなく3に保たれる(SIG、gt1およびgt2は、通常コード化されている)。各CGの場合、通常のコード化ビンおよびバイパスコード化ビンは、コード化順に分離され、最初に、CGの全ての通常のコード化ビンが送信され、その後、バイパスコード化ビンが送信される。CGにおける係数ビンの提案された順序が
図9に示されている。CGのビンは、CGのスキャン位置にわたって複数のパスでコード化される。
・パス1:コード化順に、重要度(SIG、sig_coeff_flag)、1よりも大きいフラグ(gt1、abs_level_gt1_flag)、および2よりも大きいフラグ(gt2、abs_level_gt2_flag)のコード化。1よりも大きいフラグは、sig_coeff_flagが1に等しい場合にのみ存在する。2よりも大きいフラグ(abs_level_gt2_flag)のコード化は、abs_level_gt1_flagが1に等しいスキャン位置に対してのみ実行される。gt1およびgt2の値は、ビットストリームに存在しない場合は0であると推測される。SIG、gt1、およびgt2フラグは、通常モードでコード化され、SIGのコンテキストモデリングの選択は、関連する係数に対してどのステートが選択されているかに依存する。
・パス2:abs_level_gt2_flagが1に等しい全てのスキャン位置の構文要素abs_level_remainingのコード化。非バイナリ構文要素は2値化され、結果のビンは、算術符号化エンジンのバイパスモードでコード化される。
・パス3:sig_coeff_flagが1に等しい全てのスキャン位置の符号(coeff_sign_flag)のコード化。符号は、バイパスモードでコード化される。
【0059】
上記の実施形態は、HEVCと比較して提案された変更を示している。変更は、他のソリューションに基づくこともできる。例えば、JVET-J0014がベースとして使用される場合、SIGおよびgt1の双方のコンテキストモデリングは、量子化器の選択に依存し、xよりも大きいフラグ(gtx、x=3および4)は、パス1またはパス2内にコード化されることができる。gt5、gt6、gt7フラグなど、他の通常のコード化ビンが存在する場合、それらは、パス1またはパス2内にコード化されることができる。さらに、パス3の符号(coeff_sign_flag)もまた、通常モードでコード化されることができる。
【0060】
2019年3月のミーティングにおいて、JVETは、変換スキップ残差ブロックに新たな残差コード化プロセスを採用した。変換スキップ(TS)が有効になっている場合、予測残差の変換はスキップされる。係数グループ(CG)の残差レベルは、スキャン位置を3回通過するときに以下のようにコード化される:
パス1:以下のフラグがシグナリングされる
osig_coeff_flag
ocoeff_sign_flag
o1よりも大きいフラグ(abs_level_gtx_flag[0])
oパリティ(par_level_flag)フラグ
パス2:以下のフラグがシグナリングされる
o3よりも大きいフラグ(abs_level_gtx_flag[1])
o5よりも大きいフラグ(abs_level_gtx_flag[2])
o7よりも大きいフラグ(abs_level_gtx_flag[3])
o9よりも大きいフラグ(abs_level_gtx_flag[4])
パス3:Golomb-Riceコード化を使用して、残りの絶対レベル(abs_remainder)のコード化をバイパスする。
【0061】
上記の提案された実施形態はまた、この新たに採用されたTS残差コード化にも適用されることができ、例えば、以下に示すように、3よりも大きいフラグの位置は、第1のパスに移動される。
パス1:以下のフラグがシグナリングされる
osig_coeff_flag
ocoeff_sign_flag
o1よりも大きいフラグ(abs_level_gtx_flag[0])
oパリティ(par_level_flag)フラグ
o3よりも大きいフラグ(abs_level_gtx_flag[1])
パス2:以下のフラグがシグナリングされる
o5よりも大きいフラグ(abs_level_gtx_flag[2])
o7よりも大きいフラグ(abs_level_gtx_flag[3])
o9よりも大きいフラグ(abs_level_gtx_flag[4])
パス3:Golomb-Riceコード化を使用して、残りの絶対レベル(abs_remainder)のコード化をバイパスする。
【0062】
実施形態1-関数SUM(SIG,gt1,gt2)に基づくスカラー量子化器決定スキーム
【0063】
高スループットのハードウェア実装の問題を解決するために、量子化係数の絶対レベル(absLevel)の完全な再構築は、ステートを決定するために実行されず、2つのスカラー量子化器間の切り替えは、完全な変換係数の絶対レベルのパリティに依存しない。前述のように、JVET-K0319の場合と同様にSIGによってのみ決定されるスカラー量子化器は、コード化効率を低下させる可能性がある。一実施形態では、現在の変換係数のSIG、gt1およびgt2値をともに考慮に入れる関数SUM(SIG,gt1,gt2)に基づいてスカラー量子化器を決定することを提案する。
【表4】
【0064】
変換係数のSIG、gt1、およびgt2値の可能な組み合わせが表3に示されている。これらの4つの異なる組み合わせから4つの可能なマーキングレベル値にマッピングされた1対1の対応が存在し、ここで、mは、これらの4つの可能なケースのマーキング値を示す。SIG、gt1、およびgt2の値からマーキング値mを導出する関数は、以下のように記述されることができる:
m=SUM(SIG,gt1,gt2)=SIG+gt1+gt2。
【0065】
図10に示されるように、2つのスカラー量子化器間の切り替えは、符号化/再構築順序で現在の変換係数に先行する変換係数レベルのマーキング値mのパリティによって一意に決定される。変換ブロックの逆量子化の開始時に、ステートは0に設定される。現在の変換係数の通常のコード化ビンが再構築された後、ステートは、
図10および表4に示されるように更新される。次のステートは、現在のステートと、現在の変換係数レベルのマーキング値mのパリティ(m&1)にのみ依存することに留意されたい。ステートの更新は、以下のように記述されることができる:
ステート=stateTransTable[ステート][m&1]、
ここで、stateTransTableは、
図10および表4に示される表を表し、演算子&は、2の補数演算におけるビット単位の「and」演算子を指定する。
【表5】
【表6】
【0066】
変換および量子化の後、ほとんどの変換係数の大きさは、通常、非常に低い値になる。表3および表4に示されるように、変換係数の絶対レベルが3よりも小さい場合、提案された方法は、JVET-J0014とほぼ同じ結果を達成することができる。一方、提案された方法は、量子化係数の絶対レベル(absLevel)の完全な再構築を必要とせず、高スループットのハードウェア実装の問題を解決した。
【0067】
コード化の順序とビンの存在、および送信されたデータからの変換係数レベルの再構築の詳細は、上記の構文表に示されている。説明を簡単にするために、スキャン位置の異なるパスが構文表においてコメント化されている。HEVCおよびVTM-1に関連する変更は、斜体で示している。エントロピー符号化器は、変換係数レベルの情報に依存しかつ量子化器を決定するために使用される「ステート」にしたがって、特定のSIGのコンテキストセットを選択する。
【0068】
実施形態2-関数XOR(SIG,gt1,gt2)に基づくスカラー量子化器決定スキーム
【0069】
別の実施形態では、現在の変換係数のSIG、gt1およびgt2値が考慮され、関数XOR(SIG,gt1,gt2)に基づいてスカラー量子化器が選択される。SIG、gt1およびgt2の値から排他的論理和値xを導出する関数は、以下のように記述されることができる:
x=XOR(SIG,gt1,gt2)=SIG^gt1^gt2。
変換係数のSIG、gt1、およびgt2の値の可能な組み合わせに対応する排他的論理和値xが表5に提示される。
【表7】
【0070】
第1の実施形態と比較して、2つのスカラー量子化器間の切り替えは、SIG、gt1およびgt2フラグの排他的論理和値xによって一意に決定される。ステートの更新は、以下のように記述されることができる:
ステート=stateTransTable[ステート][x]、
ここで、stateTransTableは、
図11および表6に示されている表を表す。ステートマシンの他の部分は、以前のアプローチと同様のままである。
【表8】
【0071】
表5および表6に示すように、変換係数の絶対レベルが3よりも小さい場合、提案された方法は、JVET-J0014とほぼ同じ結果を達成することができる。一方、提案された方法は、量子化係数の絶対レベル(absLevel)の完全な再構築を必要とせず、高スループットのハードウェア実装の問題を解決した。
【0072】
実施形態3-通常のコード化ビンの1つに基づくスカラー量子化器決定スキーム
【0073】
上記の実施形態によれば、現在の変換係数(SIG、gt1およびgt2)の全ての通常のコード化ビンは、スカラー量子化器を決定するために考慮される。別の実施形態では、2つのスカラー量子化器間の切り替えは、通常のコード化ビンの1つ、例えば、gt1フラグに基づくことができる。この実施形態では、
図12に示されるように、前のステート遷移は、gt1ベースのステート遷移によって置き換えられることができる一方で、他の設計は、変更されないままである。これにより、現在の変換係数を量子化するために使用されるスカラー量子化器は、スキャン順序で現在の変換係数に先行する量子化係数のgt1フラグによって決定される。ステートの更新は、以下のように記述されることができる:
ステート=stateTransTable[ステート][gt1]、
ここで、stateTransTableは、
図12および表7に示されている表を表す。
【0074】
この実施形態では、CGのビンは、以下のCG内のスキャン位置上の3つのスキャンパスでコード化される:sig、gt1およびgt2の第1のパス、残りの絶対レベルの第2のパス、および符号情報の第3のパス。変形例では、CGのビンは、以下のCGのスキャン位置上の4つのスキャンパスでコード化される:sigおよびgt1の第1のパス、gt2の第2のパス、残りの絶対レベルの第3のパス、および符号情報の第4のパス。この変形は、前の実施形態で提案された3つのスキャンパスと比較して、ビン間の依存性をさらに低減することができる。
【表9】
【0075】
あるいは、現在の変換係数を量子化するために使用されるスカラー量子化器は、スキャン順序で現在の変換係数に先行する量子化係数のgt2フラグによって決定される。より一般的には、現在の変換係数を量子化するために使用されるスカラー量子化器は、スキャン順序で現在の変換係数に先行する量子化係数の1つの通常のコード化ビン(例えば、gtxフラグ)によって決定される。
【0076】
上記の例では、係数に3つの通常のコード化ビン(SIG,gt1,gt2)を使用するHEVCに基づくいくつかの実施形態を示している。係数の通常のコード化ビンがHEVCのものと異なる場合、提案された実施形態は、変換係数ごとに異なる数(3よりも多いまたは少ない)の通常のコード化ビンを取ることによって実行されることができる。
【0077】
上記において、和関数および排他的論理和関数が考慮され、提案された実施形態はまた、変換係数レベルごとに通常のコード化ビンからの異なるステート更新導出(1/0)関数を用いて実行されることができる。
【0078】
上記では、説明は、主に逆量子化に関するものである。それに応じて量子化が調整されることに留意されたい。使用されるスカラー量子化器(Q0またはQ1)は、ビットストリームにおいて明示的にシグナリングされない。例えば、符号化器側の量子化モジュールは、ステートに基づいて現在の変換係数に使用する量子化器を選択する。現在の変換係数のステートが0または1に等しい場合、スカラー量子化器Q0が使用される。それ以外の場合(ステートは2または3に等しい)、スカラー量子化器Q1が使用される。ステートは、
図10~
図12に記載の方法を使用して、変換係数レベルの情報によって一意に決定され、復号器は、ビットストリームを適切に復号するために同じ量子化器を選択する。
【0079】
図13は、実施形態にかかる、現在の符号化ユニットを符号化する方法(1300)を示している。ステップ1305において、初期ステートは、ゼロに設定される。コード化ユニットを符号化するために、コード化ユニット内の係数がスキャンされる。コード化ユニットのスキャンパスは、コード化ユニットの各CGをスキャンパターン(対角、水平、垂直)にしたがって順番に処理し、各CG内の係数も、同様に考慮されたスキャン順序にしたがってスキャンされる。スキャンは、コード化ユニットの最後の有意係数を有するCGにおいて開始(1315)し、DC係数を有する最初のCGまで全ての係数を処理する。
【0080】
CGが最後の有意係数またはDC係数を含まない場合(1320)、CGがゼロ以外の係数を含むかどうかを示すフラグ(coded_sub_block_flag)が符号化される(1325)。最後の非ゼロのレベルまたはDC係数を含むCGの場合、coded_sub_block_flagは、1に等しいと推測され、ビットストリームには表示されない。
【0081】
coded_sub_block_flagが真の場合(1330)、3つのスキャンパスがCGに適用される。第1のパス(1335-1360)では、係数について、SIGフラグ(sig_coeff_flag)が符号化される(1335)。SIGフラグを符号化するために、コンテキストモードインデックスは、例えば、sigCtxId=getSigCtxId(ステート)などのステートを使用して決定される。SIGフラグが真の場合(1340)、gt1フラグ(abs_level_gt1_flag)が符号化される(1345)。gt1フラグが真の場合(1350)、gt2フラグ(abs_level_gt2_flag)が符号化される(1355)。SIG、gt1およびgt2フラグのうちの1つ以上に基づいて、例えば、
図10~
図12に記載されている方法を使用して、ステートが更新される(1360)。
【0082】
第2のスキャンパス(1365、1370)では、符号化器は、gt2フラグが真であるかどうかをチェックする(1365)。真の場合、残りの絶対レベル(abs_level_remaining)が符号化される(1370)。第3のスキャンパス(1375、1380)では、符号化器は、SIGフラグが真であるかどうかをチェックする(1375)。真の場合、符号フラグ(coeff_sign_flag)が符号化される(1380)。ステップ1385において、符号化器は、処理されるべきCGがさらにあるかどうかをチェックする。そうである場合、処理される次のCGに移動する(1390)。
【0083】
図14は、実施形態にかかる、現在の符号化ユニットを復号する方法(1400)を示している。ステップ1405において、初期ステートは、ゼロに設定される。符号化器側と同様に、コード化ユニットを復号するために、コード化ユニット内の係数位置がスキャンされる。スキャンは、コード化ユニットの最後の有意係数を有するCGで開始し(1415)、DC係数を有する最初のCGまで全ての係数を処理する。
【0084】
CGが最後の有意係数またはDC係数を含まない場合(1420)、CGが任意の非ゼロの係数を含むかどうかを示すフラグ(coded_sub_block_flag)が復号される(1425)。最後の非ゼロレベルまたはDC係数を含むCGの場合、coded_sub_block_flagは、1に等しいと推測される。
【0085】
coded_sub_block_flagが真の場合(1430)、3つのスキャンパスがCGに適用される。第1のパス(1435-1460)では、係数について、SIGフラグ(sig_coeff_flag)が復号される(1435)。SIGフラグを復号するために、コンテキストモードインデックスは、例えば、sigCtxId=getSigCtxId(ステート)などのステートを使用して決定される。SIGフラグが真の場合(1440)、gt1フラグ(abs_level_gt1_flag)が復号される(1445)。gt1フラグが真の場合(1450)、gt2フラグ(abs_level_gt2_flag)が復号される(1455)。SIG、gt1およびgt2フラグのうちの1つ以上に基づいて、例えば、
図10~
図12に記載されている方法を使用して、ステートが更新される(1460)。
【0086】
第2のスキャンパス(1470、1475)では、復号器は、gt2フラグが真であるかどうかをチェックする(1470)。真の場合、残りの絶対レベル(abs_level_remaining)が復号される(1475)。第3のスキャンパス(1480、1485)では、復号器は、SIGフラグが真であるかどうかをチェックする(1480)。真の場合、符号フラグ(coeff_sign_flag)が復号される(1485)。ステップ1487において、復号器は、利用可能なSIG、gt1、gt2、符号フラグ、および残りの絶対値に基づいて、変換係数を計算する。
【0087】
復号器は、処理されるべきCGがまだあるかどうかをチェックする(1490)。そうである場合、処理される次のCGに移動する(1495)。全ての係数がエントロピー復号される場合、変換係数は、依存スカラー量子化を使用して逆量子化される(1497)。変換係数のために使用されたスカラー量子化器(Q0またはQ1)は、ステートによって決定され、これは、復号された変換係数レベルの情報とともに、
図10~
図12に記載された方法を使用して導出される。
【0088】
様々な方法が、本明細書に記載されており、それらの方法のそれぞれは、説明された方法を達成するための1つ以上のステップまたは動作を備える。本方法の正しい動作のために特定の順序のステップまたは動作が必要でない限り、特定のステップおよび/または動作の順序および/または使用は、変更されてもよく、または組み合わせられてもよい。さらに、「第1の」、「第2の」などの用語は、例えば「第1の復号」および「第2の復号」など、要素、構成要素、ステップ、動作などを変更するために様々な実施形態において使用されることができる。そのような用語の使用は、特に必要な場合を除き、変更された動作の順序を意味するものではない。したがって、この例では、第1の復号は、第2の復号の前に実行される必要はなく、例えば、第2の復号との重複期間の前、最中、または重複する期間に発生することができる。
【0089】
本出願に説明されている様々な方法および他の態様を使用して、
図2および
図3に示されるように、モジュール、例えば、ビデオ符号化器200および復号器300のエントロピー符号化および復号モジュール(245、330)を変更することができる。さらに、本態様は、VVCまたはHEVCに限定されるものではなく、例えば、他の標準規格および推奨、ならびに任意のそのような標準規格および推奨に適用されることができる。特に指示されていない限り、または技術的に除外されていない限り、本出願で説明される態様は、個別にまたは組み合わせて使用されることができる。
【0090】
本出願では様々な数値が使用される。特定の値は、例示的な目的のためであり、記載された態様は、これらの特定の値に限定されるものではない。
【0091】
実施形態によれば、ビデオ復号の方法であって、ピクチャのブロック内の第1の変換係数に関連する第1のパラメータセットにアクセスすることであって、前記第1の変換係数が、復号順序で前記ピクチャの前記ブロック内の第2の変換係数に先行することと、前記第2の変換係数に関連する第2のパラメータセットにアクセスすることであって、前記第1および第2のパラメータセットが、通常モードでエントロピー符号化され、前記第2の変換係数の前記第2のパラメータセットの少なくともパラメータのコンテキストモデリングが、前記第1の変換係数の復号に依存することと、前記ブロックの第1のスキャンパスにおける前記第1および第2のパラメータセットをエントロピー復号することであって、前記第1のスキャンパスが、前記ブロックのエントロピー復号変換係数の他のスキャンパスの前に実行され、前記第1および第2の変換係数についての前記第1および第2のパラメータセットの各セットが、gt1フラグおよびgt2フラグのうちの少なくとも1つを含み、前記gt1フラグが、対応する変換係数の絶対値が1よりも大きいかどうかを示し、前記gt2フラグが、前記対応する変換係数の絶対値が2よりも大きいかどうかを示すことと、前記復号された変換係数に応答して前記ブロックを再構築することと、を備える、方法が提供される。
【0092】
実施形態によれば、ビデオ符号化の方法であって、ピクチャのブロック内の第1の変換係数に関連する第1のパラメータセットにアクセスすることであって、前記第1の変換係数が、符号化順序で前記ピクチャの前記ブロック内の第2の変換係数に先行することと、前記第2の変換係数に関連する第2のパラメータセットにアクセスすることであって、前記第1および第2のパラメータセットが、通常モードでエントロピー符号化され、前記第2の変換係数の前記第2のパラメータセットの少なくともパラメータのコンテキストモデリングが、前記第1の変換係数の符号化に依存することと、前記ブロックの第1のスキャンパスにおける前記第1および第2のパラメータセットをエントロピー符号化することであって、前記第1のスキャンパスが、前記ブロックのエントロピー符号化変換係数の他のスキャンパスの前に実行され、前記第1および第2の変換係数についての前記第1および第2のパラメータセットの各セットが、gt1フラグおよびgt2フラグのうちの少なくとも1つを含み、前記gt1フラグが、対応する変換係数の絶対値が1よりも大きいかどうかを示し、前記gt2フラグが、前記対応する変換係数の絶対値が2よりも大きいかどうかを示すことと、を備える、方法が提供される。
【0093】
別の実施形態によれば、1つ以上のプロセッサを備えるビデオ復号のための装置であって、前記1つ以上のプロセッサが、ピクチャのブロック内の第1の変換係数に関連する第1のパラメータセットにアクセスし、前記第1の変換係数が、復号順序で前記ピクチャの前記ブロック内の第2の変換係数に先行し、前記第2の変換係数に関連する第2のパラメータセットにアクセスし、前記第1および第2のパラメータセットが、通常モードでエントロピー符号化され、前記第2の変換係数の前記第2のパラメータセットの少なくともパラメータのコンテキストモデリングが、前記第1の変換係数の復号に依存し、前記ブロックの第1のスキャンパスにおける前記第1および第2のパラメータセットをエントロピー復号し、前記第1のスキャンパスが、前記ブロックのエントロピー復号変換係数の他のスキャンパスの前に実行され、前記第1および第2の変換係数についての前記第1および第2のパラメータセットの各セットが、gt1フラグおよびgt2フラグのうちの少なくとも1つを含み、前記gt1フラグが、対応する変換係数の絶対値が1よりも大きいかどうかを示し、前記gt2フラグが、前記対応する変換係数の絶対値が2よりも大きいかどうかを示し、前記復号された変換係数に応答して前記ブロックを再構築するように構成されている、装置が提供される。装置は、さらに、前記1つ以上のプロセッサに結合された1つ以上のメモリを備えることができる。
【0094】
別の実施形態によれば、1つ以上のプロセッサを備えるビデオ符号化のための装置であって、前記1つ以上のプロセッサが、ピクチャのブロック内の第1の変換係数に関連する第1のパラメータセットにアクセスし、前記第1の変換係数が、符号化順序で前記ピクチャの前記ブロック内の第2の変換係数に先行し、前記第2の変換係数に関連する第2のパラメータセットにアクセスし、前記第1および第2のパラメータセットが、通常モードでエントロピー符号化され、前記第2の変換係数の前記第2のパラメータセットの少なくともパラメータのコンテキストモデリングが、前記第1の変換係数の符号化に依存し、前記ブロックの第1のスキャンパスにおける前記第1および第2のパラメータセットをエントロピー符号化し、前記第1のスキャンパスが、前記ブロックのエントロピー符号化変換係数の他のスキャンパスの前に実行され、前記第1および第2の変換係数についての前記第1および第2のパラメータセットの各セットが、gt1フラグおよびgt2フラグのうちの少なくとも1つを含み、前記gt1フラグが、対応する変換係数の絶対値が1よりも大きいかどうかを示し、前記gt2フラグが、前記対応する変換係数の絶対値が2よりも大きいかどうかを示すように構成されている、装置が提供される。
【0095】
別の実施形態によれば、ビデオ復号の装置であって、ピクチャのブロック内の第1の変換係数に関連する第1のパラメータセットにアクセスする手段であって、前記第1の変換係数が、復号順序で前記ピクチャの前記ブロック内の第2の変換係数に先行する手段と、前記第2の変換係数に関連する第2のパラメータセットにアクセスする手段であって、前記第1および第2のパラメータセットが、通常モードでエントロピー符号化され、前記第2の変換係数の前記第2のパラメータセットの少なくともパラメータのコンテキストモデリングが、前記第1の変換係数の復号に依存する手段と、前記ブロックの第1のスキャンパスにおける前記第1および第2のパラメータセットをエントロピー復号する手段であって、前記第1のスキャンパスが、前記ブロックのエントロピー復号変換係数の他のスキャンパスの前に実行され、前記第1および第2の変換係数についての前記第1および第2のパラメータセットの各セットが、gt1フラグおよびgt2フラグのうちの少なくとも1つを含み、前記gt1フラグが、対応する変換係数の絶対値が1よりも大きいかどうかを示し、前記gt2フラグが、前記対応する変換係数の絶対値が2よりも大きいかどうかを示す手段と、前記復号された変換係数に応答して前記ブロックを再構築する手段と、を備える、装置が提供される。
【0096】
別の実施形態によれば、ビデオ符号化の装置であって、ピクチャのブロック内の第1の変換係数に関連する第1のパラメータセットにアクセスする手段であって、前記第1の変換係数が、符号化順序で前記ピクチャの前記ブロック内の第2の変換係数に先行する手段と、前記第2の変換係数に関連する第2のパラメータセットにアクセスする手段であって、前記第1および第2のパラメータセットが、通常モードでエントロピー符号化され、前記第2の変換係数の前記第2のパラメータセットの少なくともパラメータのコンテキストモデリングが、前記第1の変換係数の符号化に依存する手段と、前記ブロックの第1のスキャンパスにおける前記第1および第2のパラメータセットをエントロピー符号化する手段であって、前記第1のスキャンパスが、前記ブロックのエントロピー符号化変換係数の他のスキャンパスの前に実行され、前記第1および第2の変換係数についての前記第1および第2のパラメータセットの各セットが、gt1フラグおよびgt2フラグのうちの少なくとも1つを含み、前記gt1フラグが、対応する変換係数の絶対値が1よりも大きいかどうかを示し、前記gt2フラグが、前記対応する変換係数の絶対値が2よりも大きいかどうかを示す手段と、を備える、装置が提供される。
【0097】
別の実施形態によれば、符号化されたビデオを含む信号であって、ピクチャのブロック内の第1の変換係数に関連する第1のパラメータセットにアクセスすることであって、前記第1の変換係数が、符号化順序で前記ピクチャの前記ブロック内の第2の変換係数に先行することと、前記第2の変換係数に関連する第2のパラメータセットにアクセスすることであって、前記第1および第2のパラメータセットが、通常モードでエントロピー符号化され、前記第2の変換係数の前記第2のパラメータセットの少なくともパラメータのコンテキストモデリングが、前記第1の変換係数の符号化に依存することと、前記ブロックの第1のスキャンパスにおける前記第1および第2のパラメータセットをエントロピー符号化することであって、前記第1のスキャンパスが、前記ブロックのエントロピー符号化変換係数の他のスキャンパスの前に実行され、前記第1および第2の変換係数についての前記第1および第2のパラメータセットの各セットが、gt1フラグおよびgt2フラグのうちの少なくとも1つを含み、前記gt1フラグが、対応する変換係数の絶対値が1よりも大きいかどうかを示し、前記gt2フラグが、前記対応する変換係数の絶対値が2よりも大きいかどうかを示すことと、を実行することにより、信号が形成される。
【0098】
実施形態によれば、前記第2の変換係数の前記第2のパラメータセットの少なくともパラメータの前記コンテキストモデリングは、前記第1の変換係数の前記第1のパラメータセットの復号に依存し、(1)前記第1の変換係数を表すために使用されかつ(2)バイパスモードでエントロピー符号化されたパラメータとは無関係である。
【0099】
実施形態によれば、SIGフラグはまた、第1のスキャンパスにおいて符号化または復号され、前記SIGフラグは、前記対応する変換係数がゼロであるかどうかを示す。
【0100】
実施形態によれば、前記gt1フラグは、第1のスキャンパスにおいて符号化または復号され、前記gt2フラグは、第2のスキャンパスにおいて符号化または復号される。
【0101】
実施形態によれば、前記第2の変換係数を逆量子化するための逆量子化器は、前記第1の変換係数に基づいて、2つ以上の量子化器の間で選択される。
【0102】
実施形態によれば、前記逆量子化器は、前記第1の変換係数の前記第1のパラメータセットに基づいて選択される。
【0103】
実施形態によれば、前記第2の変換係数の前記第2のパラメータセット内の少なくともパラメータのコンテキストモデリングは、前記第1および第2の変換係数の復号に依存する。
【0104】
実施形態によれば、前記逆量子化器は、前記SIG、gt1、およびgt2フラグの和に基づいて選択される。
【0105】
実施形態によれば、前記逆量子化器は、前記SIG、gt1、およびgt2フラグのXOR関数に基づいて選択される。
【0106】
実施形態によれば、前記逆量子化器は、前記gt1フラグ、前記gt2フラグ、または前記対応する変換係数の絶対値がxよりも大きいかどうかを示すgtxフラグに基づいて選択される。
【0107】
実施形態によれば、(1)前記ブロック内の変換係数を表すために使用されるパラメータおよび(2)バイパスモードでコード化されるパラメータは、パラメータが(1)前記ブロック内の変換係数を表すために使用されかつ(2)前記通常モードでコード化された後の1つ以上のスキャンパスでエントロピー符号化または復号される。
【0108】
実施形態によれば、前記SIG、gt1、gt2フラグまたはgtxフラグのコンテキストモデリングは、量子化器または量子化器の選択において使用されるステートに基づく。
【0109】
実施形態は、1つ以上のプロセッサによって実行されると、1つ以上のプロセッサに、上述した実施形態のいずれかにかかる符号化方法または復号方法を実行させる命令を備えるコンピュータプログラムを提供する。本実施形態のうちの1つ以上はまた、上述した方法のいずれかにしたがってビデオデータを符号化または復号する命令を記憶したコンピュータ可読記憶媒体を提供する。1つ以上の実施形態はまた、上述した方法にしたがって生成されたビットストリームを記憶したコンピュータ可読記憶媒体を提供する。1つ以上の実施形態はまた、上述した方法にしたがって生成されたビットストリームを送信または受信する方法および装置を提供する。
【0110】
様々な実装が復号を伴う。本出願で使用される「復号」は、例えば、表示に適した最終出力を生成するために、受信した符号化されたシーケンスで実行されるプロセスの全てまたは一部を包含することができる。様々な実施形態では、そのようなプロセスは、復号器によって通常実行されるプロセスのうちの1つ以上、例えば、エントロピー復号、逆量子化、逆変換、および差分復号を含む。「復号プロセス」という語句が、具体的に動作のサブセットを指すことを意図しているか、または一般により広い復号プロセスを指すことを意図しているかは、特定の説明のコンテキストに基づいて明確になり、当業者によって十分に理解されると考えられる。
【0111】
様々な実装は符号化を伴う。「復号」に関する上記の考察と同様に、本出願で使用される「符号化」は、例えば、符号化されたビットストリームを生成するために入力ビデオシーケンスで実行されるプロセスの全てまたは一部を包含することができる。
【0112】
例えば、sig_coeff_flag、abs_level_gt1_flagなどの本明細書で使用される構文要素は、説明的な用語であることに留意されたい。したがって、それらは、他の構文要素名の使用を排除するものではない。
【0113】
本明細書で説明された実装および態様は、例えば、方法もしくはプロセス、装置、ソフトウェアプログラム、データストリーム、または信号で実装されることができる。単一形式の実装のコンテキストにおいて考察される(例えば、方法としてのみ考察される)のみの場合であっても、考察される特徴の実装はまた、他の形態(例えば、装置またはプログラム)で実装されてもよい。装置は、例えば、適切なハードウェア、ソフトウェア、およびファームウェアで実装されることができる。この方法は、例えば、装置、例えば、コンピュータ、マイクロプロセッサ、集積回路、またはプログラマブルロジック装置を含む、一般に処理装置を指す、例えば、プロセッサなどに実装されることができる。プロセッサはまた、通信装置、例えば、コンピュータ、携帯電話、ポータブル/パーソナルデジタルアシスタンス(「PDA」)、およびエンドユーザ間の情報の伝達を容易にする他の装置も含む。
【0114】
「一実施形態」もしくは「実施形態」、または「一実装」もしくは「実装」、ならびにそれらの他の変形への言及は、実施形態に関連して説明された特定の特徴、構造、特性などが、少なくとも1つの実施形態に含まれることを意味する。したがって、本文書全体にわたって様々な箇所においてみられる、「一実施形態では」もしくは「実施形態では」または「一実装では」もしくは「実装では」という句、ならびに任意の他の変形の出現は、必ずしも全てが同じ実施形態を指しているわけではない。
【0115】
さらに、本出願は、情報の様々な部分を「決定すること」に言及する場合がある。情報を決定することは、例えば、情報を推定すること、情報を計算すること、情報を予測すること、またはメモリから情報を検索することのうちの1つ以上を含むことができる。
【0116】
さらに、本出願は、情報の様々な部分に「アクセスすること」に言及する場合がある。情報にアクセスすることは、例えば、情報を受信すること、情報を検索すること(例えば、メモリから)、情報を記憶すること、情報を移動させること、情報をコピーすること、情報を計算すること、情報を決定すること、情報を予測すること、または情報を推定することのうちの1つ以上を含むことができる。
【0117】
さらに、本出願は、情報の様々な部分を「受信すること」に言及する場合がある。受信することは、「アクセスすること」と同様に、広義の用語であることが意図されている。情報を受信することは、例えば、情報にアクセスすること、または(例えば、メモリから)情報を検索することのうちの1つ以上を含むことができる。さらに、「受信すること」は、典型的には、何らかの方法で、例えば、情報を記憶すること、情報を処理すること、情報を送信すること、情報を移動させること、情報をコピーすること、情報を消去すること、情報を計算すること、情報を決定すること、情報を予測すること、または情報を推定することなどの動作中に含まれる。
【0118】
例えば、「A/B」、「Aおよび/またはB」、ならびに「AおよびBのうちの少なくとも1つ」の場合、次の「/」、「および/または」、ならびに「のうちの少なくとも1つ」のいずれかの使用は、最初に挙げた選択肢(A)のみの選択、または2番目に挙げた選択肢(B)のみの選択、または双方の選択肢(AおよびB)の選択を網羅することを意図していることが分かるはずである。さらなる例として、「A、B、および/またはC」ならびに「A、BおよびCのうちの少なくとも1つ」の場合、そのような言い回しは、最初に挙げた選択肢(A)のみの選択、または2番目に挙げた選択肢(B)のみの選択、または3番目に挙げた(C)のみの選択、または最初および2番目に挙げた選択肢(AおよびB)のみの選択、または最初および3番目に挙げた選択肢(AおよびC)のみの選択、または2番目および3番目に挙げた選択肢(BおよびC)のみの選択、または3つ全ての選択肢(A、BおよびC)の選択、を網羅することを意図している。これは、当業者にとって明らかなように、挙げられる項目の数だけ拡張されることができる。
【0119】
当業者にとって明らかであるように、実装は、例えば、記憶または送信されることができる情報を搬送するようにフォーマットされる多種多様な信号を生成することができる。情報は、例えば、方法を実行する命令、または説明される実装のうちの1つにより生成されたデータを含むことができる。例えば、信号は、説明された実施形態のビットストリームを搬送するようにフォーマットされてもよい。そのような信号は、例えば、電磁波(例えば、スペクトルの無線周波数部分を使用して)として、またはベースバンド信号としてフォーマットされてもよい。フォーマットすることは、例えば、データストリームを符号化することと、搬送波を符号化データストリームで変調することと、を含むことができる。信号が搬送する情報は、例えば、アナログ情報またはデジタル情報とすることができる。信号は、既知の如く、多種多様な異なる有線リンクまたは無線リンクを介して送信されることができる。信号は、プロセッサ可読媒体に記憶されることができる。