特開2024-152804 | 知財ポータル「IP Force」

知財求人 - 知財ポータルサイト「IP Force」

青山学院大学 (神奈川県相模原市中央区淵野辺)

▶ テンセント・アメリカ・エルエルシーの特許一覧

特開2024-152804ジョイント成分の二次変換

書誌要約請求の範囲詳細な説明課題実施例実施するための形態図面の説明

目に優しい文字サイズ小中大 PDF Top

< >

1
2
3
4
5
6
7
8
9
10

(19)【発行国】日本国特許庁(JP)

(12)【公報種別】公開特許公報(A)

(11)【公開番号】P2024152804

(43)【公開日】2024-10-25

(54)【発明の名称】ジョイント成分の二次変換

(51)【国際特許分類】

H04N 19/60 20140101AFI20241018BHJP

【ＦＩ】

H04N19/60

【審査請求】有

【請求項の数】1

【出願形態】ＯＬ

【外国語出願】

(21)【出願番号】P 2024131004

(22)【出願日】2024-08-07

(62)【分割の表示】P 2023140479の分割

【原出願日】2020-11-02

(31)【優先権主張番号】63/020,280

(32)【優先日】2020-05-05

(33)【優先権主張国・地域又は機関】US

(31)【優先権主張番号】17/072,606

(32)【優先日】2020-10-16

(33)【優先権主張国・地域又は機関】US

(71)【出願人】

【識別番号】520353802

【氏名又は名称】テンセント・アメリカ・エルエルシー

(74)【代理人】

【識別番号】100110364

【弁理士】

【氏名又は名称】実広信哉

(74)【代理人】

【識別番号】100150197

【弁理士】

【氏名又は名称】松尾直樹

(72)【発明者】

【氏名】シン・ジャオ

(72)【発明者】

【氏名】セフン・ヤ

(72)【発明者】

【氏名】シャン・リュウ

(57)【要約】

【課題】少なくとも１つのプロセッサを使用して、符号化されたビデオビットストリームを復号化する方法を提供する。
【解決手段】符号化されたカラー成分を含む符号化されたビデオビットストリームを取得するステップと、前記符号化されたカラー成分をエントロピー解析するステップと、前記カラー成分を非量子化し、前記カラー成分の変換係数を取得するステップと、前記カラー成分の変換係数にジョイント成分二次変換（ＪＣＳＴ）を適用することによってＪＣＳＴ出力を生成するステップと、前記ＪＣＳＴ出力に逆変換を実行することによって前記カラー成分の残差成分を求めるステップと、前記カラー成分の残差成分に基づいて、前記符号化されたビデオビットストリームを復号化するステップとを含む。
【選択図】図１

【特許請求の範囲】

【請求項1】

少なくとも１つのプロセッサを使用して、符号化されたビデオビットストリームを復号化する方法であって、
符号化されたカラー成分を含む符号化されたビデオビットストリームを取得するステップと、
前記符号化されたカラー成分をエントロピー解析するステップと、
前記カラー成分を非量子化し、前記カラー成分の変換係数を取得するステップと、
前記カラー成分の変換係数にジョイント成分二次変換（ＪＣＳＴ）を適用することで、ＪＣＳＴ出力を生成するステップと、
前記ＪＣＳＴ出力に対して逆変換を実行することで、前記カラー成分の残差成分を求めるステップと、
前記カラー成分の残差成分に基づいて、前記符号化されたビデオビットストリームを復号化するステップと、を含む方法。

【請求項2】

前記変換成分は、Ｃｂ及びＣｒ変換係数を含む、請求項１に記載の方法。

【請求項3】

前記変換成分は、Ｙ、Ｃｂ及びＣｒ変換係数を含む、請求項１に記載の方法。

【請求項4】

前記ＪＣＳＴは、要素ごとに適用される、請求項１に記載の方法。

【請求項5】

前記カラー成分は、異なる座標に配置された２つ以上のペアの異なるカラー成分を含む、請求項１に記載の方法。

【請求項6】

前記ＪＣＳＴは、限られた範囲内のブロックサイズに適用される、請求項１に記載の方法。

【請求項7】

前記符号化されたビデオビットストリームから、符号化された画像に対応する画像ユニットを含む、符号化されたビデオシーケンス（ＣＶＳ）を取得するステップと、
前記画像ユニットに含まれる画像ヘッダ（ＰＨ）ネットワーク抽象化レイヤ（ＮＡＬ）ユニットを取得するステップと、
前記画像ユニットに含まれる少なくとも１つのビデオコーディング層（ＶＣＬ）ＮＡＬユニットを取得するステップと、
前記ＪＣＳＴがいつから適用されるかを変換ブロックレベルで信号で通知するＪＣＳＴフラグを解析するステップと、を含む、請求項１に記載の方法。

【請求項8】

前記符号化されたビデオビットストリームから、符号化された画像に対応する画像ユニットを含む、符号化されたビデオシーケンス（ＣＶＳ）を取得するステップと、
前記画像ユニットに含まれる画像ヘッダ（ＰＨ）ネットワーク抽象化レイヤ（ＮＡＬ）ユニットを取得するステップと、
前記画像ユニットに含まれる少なくとも１つのビデオコーディング層（ＶＣＬ）ＮＡＬユニットを取得するステップと、
前記ＪＣＳＴがいつから適用されるかをＣＵまたはＣＢレベルで信号で通知するＪＣＳＴフラグを解析するステップと、を含む、請求項１に記載の方法。

【請求項9】

前記符号化されたビデオビットストリームから、符号化された画像に対応する画像ユニットを含む、符号化されたビデオシーケンス（ＣＶＳ）を取得するステップと、
前記画像ユニットに含まれる画像ヘッダ（ＰＨ）ネットワーク抽象化レイヤ（ＮＡＬ）ユニットを取得するステップと、
前記画像ユニットに含まれる少なくとも１つのビデオコーディング層（ＶＣＬ）ＮＡＬユニットを取得するステップと、
前記ＪＣＳＴがいつから高レベル構文を介して適用されるかを信号で通知するＪＣＳＴフラグを解析するステップと、を含む、請求項１に記載の方法。

【請求項10】

前記ＪＣＳＴは、符号化情報によって決定される第２の変換を含む、請求項１に記載の方法。

【請求項11】

符号化されたビデオビットストリームを復号化するための装置であって、コンピュータプログラムコードを格納するように構成された少なくとも１つのメモリと、
前記少なくとも１つのメモリにアクセスするとともに、前記コンピュータプログラムコードに従って動作するように構成された少なくとも１つのプロセッサとを備え、
前記コンピュータプログラムコードは、
前記少なくとも１つのプロセッサに、符号化されたカラー成分を含む符号化されたビデオビットストリームを取得させるように構成された第１の取得コードと、
前記少なくとも１つのプロセッサに、符号化されたカラー成分をエントロピー解析させるように構成された第１の解析コードと、
前記少なくとも１つのプロセッサに、前記符号化されたカラー成分を非量子化し、前記カラー成分の変換係数を取得させるように構成された非量子化コードと、
前記少なくとも１つのプロセッサに、前記カラー成分の変換係数にＪＣＳＴを適用させることによってＪＣＳＴ出力を生成させるように構成されたジョイント成分二次変換（ＪＣＳＴ）適用コードと、
前記少なくとも１つのプロセッサに、前記ＪＣＳＴ出力に逆方向変換を適用させることによって前記カラー成分の残差成分を求めるように構成された逆方向変換コードと、
少なくとも１つのプロセッサに、前記カラー成分の残差成分に基づいて、前記符号化されたビデオビットストリームを復号化させるように構成された復号化コードとを含む、装置。

【請求項12】

前記変換成分は、Ｃｂ及びＣｒ変換係数を含む、請求項１１に記載の装置。

【請求項13】

前記変換成分は、Ｙ、Ｃｂ及びＣｒ変換係数を含む、請求項１１に記載の装置。

【請求項14】

前記ジョイント成分二次変換（ＪＣＳＴ）適用コードは、前記少なくとも１つのプロセッサにＪＣＳＴを要素ごとに適用させるように構成された、請求項１１に記載の装置。

【請求項15】

前記カラー成分は、異なる座標に配置された２つ以上のペアの異なるカラー成分を含む、請求項１１に記載の装置。

【請求項16】

前記ジョイント成分二次変換（ＪＣＳＴ）適用コードは、前記少なくとも１つのプロセッサにＪＣＳＴを限られた範囲内のブロックサイズに適用させるように構成された、請求項１１に記載の方法。

【請求項17】

前記コンピュータプログラムコードは、さらに、
前記少なくとも１つのプロセッサに、前記符号化されたビデオビットストリームから、符号化された画像に対応する画像ユニットを含む符号化されたビデオシーケンス（ＣＶＳ）を取得させるように構成された第２の取得コードと、
前記少なくとも１つのプロセッサに、前記画像ユニットに含まれる画像ヘッダ（ＰＨ）ネットワーク抽象化レイヤ（ＮＡＬ）ユニットを取得させるように構成された第３の取得コードと、
前記少なくとも１つのプロセッサに、前記画像ユニットに含まれる少なくとも１つのビデオコーディング層（ＶＣＬ）ＮＡＬユニットを取得させるように構成された第４の取得コードと、
前記少なくとも１つのプロセッサに、前記ＪＣＳＴがいつから適用されるかを変換ブロックレベルで信号で通知するＪＣＳＴフラグを解析させるように構成された第２の解析コードと、を含む、請求項１１に記載の装置。

【請求項18】

前記コンピュータプログラムコードは、さらに、
前記少なくとも１つのプロセッサに、前記符号化されたビデオビットストリームから、符号化された画像に対応する画像ユニットを含む符号化されたビデオシーケンス（ＣＶＳ）を取得させるように構成された第２の取得コードと、
前記少なくとも１つのプロセッサに、前記画像ユニットに含まれる画像ヘッダ（ＰＨ）ネットワーク抽象化レイヤ（ＮＡＬ）ユニットを取得させるように構成された第３の取得コードと、
前記少なくとも１つのプロセッサに、前記画像ユニットに含まれる少なくとも１つのビデオコーディング層（ＶＣＬ）ＮＡＬユニットを取得させるように構成された第４の取得コードと、
前記少なくとも１つのプロセッサに、前記ＪＣＳＴがいつから適用されるかをＣＵまたはＣＢレベルで信号で通知するＪＣＳＴフラグを解析させるように構成された第２の解析コードと、を含む、請求項１１に記載の装置。

【請求項19】

前記コンピュータプログラムコードは、さらに、
前記少なくとも１つのプロセッサに、前記符号化されたビデオビットストリームから、符号化された画像に対応する画像ユニットを含む符号化されたビデオシーケンス（ＣＶＳ）を取得させるように構成された第２の取得コードと、
前記少なくとも１つのプロセッサに、前記画像ユニットに含まれる画像ヘッダ（ＰＨ）ネットワーク抽象化レイヤ（ＮＡＬ）ユニットを取得させるように構成された第３の取得コードと、
前記少なくとも１つのプロセッサに、前記画像ユニットに含まれる少なくとも１つのビデオコーディング層（ＶＣＬ）ＮＡＬユニットを取得させるように構成された第４の取得コードと、
前記少なくとも１つのプロセッサに、前記ＪＣＳＴがいつから高レベル構文を介して適用されるかを信号で通知するＪＣＳＴフラグを解析させるように構成された第２の解析コードと、を含む、請求項１１に記載の装置。

【請求項20】

少なくとも１つのプロセッサに、以下の操作を行わせる命令が格納されている非一時的コンピュータ可読記憶媒体であって、
符号化されたカラー成分を含む符号化されたビデオビットストリームを取得する；
前記符号化されたカラー成分をエントロピー解析する；
前記カラー成分を非量子化し、前記カラー成分の変換係数を取得する；
前記カラー成分の変換係数にジョイント成分二次変換（ＪＣＳＴ）を適用することによってＪＣＳＴ出力を生成する；
前記ＪＣＳＴ出力に逆変換を実行することによって前記カラー成分の残差成分を求める；
前記カラー成分の残差成分に基づいて、前記符号化されたビデオビットストリームを復号化する。

【発明の詳細な説明】

【技術分野】

【0001】

関連出願の相互参照
本出願は、２０２０年５月５日に提出された米仮特許出願第６３／０２０，２８０号及び２０２０年１０月１６日に提出された米特許出願第１７／０７２，６０６号に対する優先権の利益を主張し、その内容全体が援用により本明細書に組み込まれる。

【0002】

本開示は、一般的にデータ処理の分野、より具体的には、ビデオの符号化および復号化化に関する。さらにより具体的には、本開示の実施形態は、複数のカラー成分からの残差、例えば、２つのクロマ成分からの残差を符号化するためのジョイント成分二次変換（ｊｏｉｎｔｃｏｍｐｏｎｅｎｔｓｓｅｃｏｎｄａｒｙｔｒａｎｓｆｏｒｍ，ＪＣＳＴ）技術案に関する。

【背景技術】

【0003】

ＡＯＭｅｄｉａビデオ１（ＡＯＭｅｄｉａＶｉｄｅｏ１，ＡＶ１）は、インターネットを介したビデオ伝送用に設計されたオープンビデオコーディング形式である。ＡＶ１はＶＰ９の後継として、２０１５年に設立され、半導体企業、ビデオオンデマンドプロバイダー、ビデオコンテンツプロデューサー、ソフトウェア開発会社及びＷｅｂブラウザーベンダーからなるオープンメディアアライアンス（ＡｌｌｉａｎｃｅｆｏｒＯｐｅｎＭｅｄｉａ，ＡＯＭｅｄｉａ）によって開発された。ＡＶ１プロジェクトの多くの構成要素は、ＡＯＭｅｄｉａメンバーによる以前の研究活動から供給された。そして、個人貢献者は、何年も前から実験的なテクノロジープラットフォームを開始した。例えば、Ｘｉｐｈ’ｓ／ＭｏｚｉｌｌａのＤａａｌａは２０１０年にコードを公開した。Ｇｏｏｇｌｅの実験的ＶＰ９進化プロジェクトＶＰ１０は、２０１４年９月１２日に発表された。ＣｉｓｃｏのＴｈｏｒは２０１５年８月１１日に公開された。

【0004】

ＶＰ９のコードベースをもとに構築されたＡＶ１には、別の技術が組み込まれており、その幾つかはこれらの実験形式で開発された。ＡＶ１リファレンスコーデックの最初のバージョン（０．１．０）は、２０１６年４月７日にリリースされた。ＡＯＭｅｄｉａは、リファレンスソフトウェアベースのエンコーダーとデコーダーとともに、２０１８年３月２８日にＡＶ１ビットストリーム仕様のリリースを発表した。２０１８年６月２５日に、ＡＶ１仕様の検証済みバージョン１．０．０はリリースされた。２０１９年１月８日にＡＶ１仕様の検証済みバージョン１．０．０は、Ｅｒｒａｔａ１とともにリリースされた。ＡＶ１ビットストリーム仕様には、リファレンスビデオコーデックが含まれている。

【発明の概要】

【課題を解決するための手段】

【0005】

ＡＶ１では、クロマチャネルに対して生成された予測残差信号、例えばＣｂとＣｒは相互に高い相関関係にあるため、ＣｂとＣｒの予測残差間の統計的冗長性を減らすことで残差の符号化をさらに向上させることが期待できる。

【0006】

本開示の実施形態は、前記課題の解決策を提供する。

【0007】

例えば、少なくとも１つのプロセッサを使用して、符号化されたビデオビットストリームを復号化する方法であって、符号化されたカラー成分を含む符号化されたビデオビットストリームを取得するステップと、符号化されたカラー成分をエントロピー解析するステップと、カラー成分を非量子化し、カラー成分の変換係数を取得するステップと、カラー成分の変換係数にジョイント成分二次変換（ＪＣＳＴ）を適用することによってＪＣＳＴ出力を生成するステップと、ＪＣＳＴ出力に逆変換を実行することによってカラー成分の残差成分を求めるステップと、カラー成分の残差成分に基づいて、符号化されたビデオビットストリームを復号化するステップとを含む。

【図面の簡単な説明】

【0008】

【図1】ローカルテンプレートによってカバーされる符号化係数の概略図である。

【図2】実施形態による通信システムのブロック図である。

【図3】実施形態による、環境におけるＧ－ＰＣＣ（ｇｒａｐｈ－ｂａｓｅｄｐｏｉｎｔｃｌｏｕｄｃｏｍｐｒｅｓｓｉｏｎ），Ｇ－ＰＣＣコンプレッサー及びＧ－ＰＣＣデコンプレッサーの配置方式を示す図である。

【図4】実施形態によるエンコーダ／デコーダスキームの概略図である。

【図5】実施形態によるエンコーダ／デコーダスキームの概略図である。

【図6】実施形態による、２つの４×２サイズのブロックから由来するＣｂ及びＣｒ変換係数の対の概略図である。

【図7】実施形態による、２つの４×２サイズのＣｂブロック及びＣｒブロックに適用されたＪＣＳＴの概略図である。

【図8】実施形態による４点変換を利用するＪＣＳＴの概略図である。

【図9】実施形態による復号化方法を示すフローチャートである。

【図10】各実施形態を実施するのに適したコンピュータシステムを示す図である。

【発明を実施するための形態】

【0009】

本明細書に記載の実施形態は、画像データを符号化および／または復号化化するための方法および装置を提供する。

【0010】

ＡＶ１による残差符号化

【0011】

定められた変換ユニットごとに、ＡＶ１係数エンコーダはスキップ記号から始まり、続いて変換カーネルタイプと、変換コーディングがスキップされない場合はすべての非ゼロ係数のブロック終了（ｅｎｄ－ｏｆ－ｂｌｏｃｋ，ＥＯＢ）位置を符号化する。次に、各係数値を複数の階層図及び記号にマッピングさせることができる。ここで、記号層は係数の記号及び３つの階層をカバーし、各係数値は係数の異なる階層範囲、即ち下位層、中位層及び上位層に対応する。下位層は０～２の範囲に対応し、中位層は３～１４の範囲に対応し、上位層は１５以上の範囲に対応する。

【0012】

ＥＯＢ位置が符号化された後、係数の大きさが０から２の間にあるか否かを示す下位層と、その大きさが３から１４の間にあるか否かを示す中位層を逆方向スキャン順で一緒に符号化し、次に、記号層と、大きさが１４以上の残差値を示す上位層を順方向スキャン順で一緒に符号化する。残りの部分はＥｘｐ－Ｇｏｌｏｍｂコードでエントロピーコード化される。ＡＶ１では、従来のジグザグスキャン順序を採用している。

【0013】

このような分離は、下位層への豊富なコンテキストモデルの割り当てを可能にする。その中に、双方向、水平、および垂直などの変換方向、変換サイズ、および適度なコンテキストモデルサイズでの圧縮効率の向上のための最大５つの隣接係数が考慮される。中位層では、下位層と類似するコンテキストモデルが使用され、その中のコンテキスト隣接係数の数が５から２まで減る。上位層では、コンテキストモデルを使用せずにＥｘｐ－Ｇｏｌｏｍｂコードを使用して符号化する。記号層では、ＤＣ記号を除いた記号は、隣接変換ユニットのＤＣ記号をコンテキスト情報として使用して符号化される。他の記号ビットは、コンテキストモデルを使用せずにそのまま符号化される。

【0014】

汎用ビデオコーティング（ＶｅｒｓａｔｉｌｅＶｉｄｅｏＣｏｄｉｎｇ，ＶＶＣ）では、コーディングブロックは最初に４×４サイズのサブブロックに分割され、コーディングブロック内のサブブロックと、サブブロック内の変換係数は、予め定義されたスキャン順序に従って符号化される。少なくとも１つの非ゼロ変換係数を有するサブブロックの場合は、変換係数のコーディングは４つのスキャンパスに分けられる。

【0015】

例えば、ａｂｓＬｅｖｅｌが現在の変換係数の絶対値であると想定される。第１のパスでは、構文要素ｓｉｇ＿ｃｏｅｆｆ＿ｆｌａｇ（ａｂｓＬｅｖｅｌが０より大きいことを示す）、ｐａｒ＿ｌｅｖｅｌ＿ｆｌａｇ（ａｂｓＬｅｖｅｌのパリティを示す）、およびｒｅｍ＿ａｂｓ＿ｇｔ１＿ｆｌａｇ（（ａｂｓＬｅｖｅｌ－１）＞＞１は０より大きいことを示す）が符号化される；第２のパスでは、構文要素ｒｅｍ＿ａｂｓ＿ｇｔ２＿ｆｌａｇ（ａｂｓＬｅｖｅｌが４より大きいことを示す）が符号化される；第３のパスでは、係数レベルの残りの値（ａｂｓ＿ｒｅｍａｉｎｄｅｒと呼ばれる）が呼び出される；そして必要に応じて、第４のパスでは、記号情報が符号化される。

【0016】

変換係数間の相関性を利用するために、図１に示されるローカルテンプレートによってカバーされる符号化済みの係数が、現在の係数のコンテキスト選択に使用される。図中、黒で示される位置（１０１）は、現在の変換係数の位置を示す。網掛け部分で示される位置（１０２）は、その５つの隣接係数を示す。ここで、ａｂｓＬｅｖｅｌ１［ｘ］［ｙ］は、第１のパスの後に位置（ｘ、ｙ）での係数の部分的に再構成された絶対レベルを表し、ｄは、現在の係数の対角線位置（ｄ＝ｘ＋ｙ）を表し、ｎｕｍＳｉｇはローカルテンプレートにおける非ゼロ係数の数を表し、ｓｕｍＡｂｓ１はローカルテンプレートによってカバーされる係数の部分的に再構成された絶対レベルａｂｓＬｅｖｅｌ１［ｘ］［ｙ］の合計を表す。

【0017】

現在の係数であるｓｉｇ＿ｃｏｅｆｆ＿ｆｌａｇを符号化する場合、コンテキストモデルインデックスは、ｓｕｍＡｂｓ１と対角位置ｄに応じて選択される。より具体的には、Ｌｕｍａ成分の場合、コンテキストモデルインデックスは下記式１：ｃｔｘＳｉｇ＝１８＊ｍａｘ（０，ｓｔａｔｅ－１）＋ｍｉｎ（ｓｕｍＡｂｓ１，５＋（ｄ＜２？１２：（ｄ＜５？６：０））に従って決定される。これは、次の式２および式３と同等である。式２：ｃｔｘＩｄＢａｓｅ＝１８＊ｍａｘ（０，ｓｔａｔｅ－１＋（ｄ＜２？１２：（ｄ＜５？６：０））。式３：ｃｔｘＳｉｇ＝ｃｔｘＩｄＳｉｇＴａｂｌｅ［ｍｉｎ（ｓｕｍＡｂｓ１，５）］＋ｃｔｘＩｄＢａｓｅ。

【0018】

Ｃｈｒｏｍａの場合、コンテキストモデルインデックスは下記式４：ｃｔｘＳｉｇ＝１２＊ｍａｘ（０，ｓｔａｔｅ－１＋ｍｉｎ（ｓｕｍＡｂｓ１，５＋（ｄ＜２？６：０）に従って決定される。これは次の式５および式６と同等である。式５：ｃｔｘＩｄＢａｓｅ＝１２＊ｍａｘ（０，ｓｔａｔｅ－１＋（ｄ＜２？６：０）。式６：ｃｔｘＳｉｇ＝ｃｔｘＩｄＳｉｇＴａｂｌｅ［ｍｉｎ（ｓｕｍＡｂｓ１，５）］＋ｃｔｘＩｄＢａｓｅ。

【0019】

ここで、依存量子化が利用され、状態が状態変換プロセスを使用して導出される場合、スカラー量子化器が使用される。テーブルｃｔｘＩｄＳｉｇＴａｂｌｅには、コンテキストモデルインデックスオフセット、ｃｔｘＩｄＳｉｇＴａｂｌｅ［０～５］＝｛０，１，２，３，４，５｝が格納されている。

【0020】

現在の係数であるｐａｒ＿ｌｅｖｅｌ＿ｆｌａｇを符号化する場合に、コンテキストモデルインデックスは、ｓｕｍＡｂｓ１、ｎｕｍＳｉｇおよび対角位置ｄに応じて選択される。より具体的には、Ｌｕｍａ成分に対して、コンテキストモデルインデックスは下記式７：ｃｔｘＰａｒ＝１＋ｍｉｎ（ｓｕｍＡｂｓ１－ｎｕｍＳｉｇ，４）＋（ｄ＝＝０？１５：（ｄ＜３？１０：（ｄ＜１０？５：０）））に従って決定される。これは、次の式８および式９と同等である。式８：ｃｔｘＩｄＢａｓｅ＝（ｄ＝＝０？１５：（ｄ＜３？１０：（ｄ＜１０？５：０）））。式９：ｃｔｘＰａｒ＝１＋ｃｔｘＩｄＴａｂｌｅ［ｍｉｎ（ｓｕｍＡｂｓ１－ｎｕｍＳｉｇ，４］＋ｃｔｘＩｄＢａｓｅ。クロマの場合、コンテキストモデルインデックスは下記式１０：ｃｔｘＰａｒ＝１＋ｍｉｎ（ｓｕｍＡｂｓ１－ｎｕｍＳｉｇ，４）＋（ｄ＝＝０？５：０）に従って決定される。これは次の式１１および式１２と同等である。式１１：ｃｔｘＩｄＢａｓｅ＝（ｄ＝＝０？５：０）。式１２：ｃｔｘＰａｒ＝１＋ｃｔｘＩｄＴａｂｌｅ［ｍｉｎ（ｓｕｍＡｂｓ１－ｎｕｍＳｉｇ，４）］＋ｃｔｘＩｄＢａｓｅ。

【0021】

ここで、テーブルｃｔｘＩｄＴａｂｌｅには、コンテキストモデルインデックスオフセット、ｃｔｘＩｄＴａｂｌｅ［０～４］＝｛０，１，２，３，４｝が格納されている。現在の係数であるｒｅｍ＿ａｂｓ＿ｇｔ１＿ｆｌａｇおよびｒｅｍ＿ａｂｓ＿ｇｔ２＿ｆｌａｇを符号化する場合、コンテキストモデルインデックスはｐａｒ＿ｌｅｖｅｌ＿ｆｌａｇの場合と同じ方法で決定される。ｃｔｘＧｔ１＝ｃｔｘＰａｒおよびｃｔｘＧｔ２＝ｃｔｘＰａｒ（式１３）。

【0022】

ｒｅｍ＿ａｂｓ＿ｇｔ１＿ｆｌａｇとｒｅｍ＿ａｂｓ＿ｇｔ２＿ｆｌａｇには異なるコンテキストモデルセットが使用される。したがって、ｃｔｘＧｔ１がｃｔｘＧｔ２と等しい場合でも、ｒｅｍ＿ａｂｓ＿ｇｔ１＿ｆｌａｇに使用されるコンテキストモデルは、ｒｅｍ＿ａｂｓ＿ｇｔ２＿ｆｌａｇのコンテキストモデルと異なる。

【0023】

変換スキップモード（ＴｒａｎｓｆｏｒｍＳｋｉｐＭｏｄｅ，ＴＳＭ）および差分パルス符号化変調（ＤｉｆｆｅｒｅｎｔｉａｌＰｕｌｓｅ－ＣｏｄｅＭｏｄｕｌａｔｉｏｎ，ＤＰＣＭ）のための残差符号化

【0024】

残差符号化を、量子化された予測残差（空間ドメイン）を表す変換スキップおよびブロック差分パルス符号化変調（ＢｌｏｃｋＤｉｆｆｅｒｅｎｔｉａｌＰｕｌｓｅ－ＣｏｄｅＭｏｄｕｌａｔｉｏｎ，ＢＤＰＣＭ）の残差レベルの統計および信号特徴に適合させるために、以上のＡＶ１の残差符号化部分に記載された残差符号化スキームに加えて、次の残差符号化プロセスを変更することが提案され、ＴＳＭおよびＢＤＰＣＭモードに適用される。

【0025】

以下で、３つの符号化パスについて説明する。第１の符号化パスでは、最初にｓｉｇ＿ｃｏｅｆｆ＿ｆｌａｇ、ｃｏｅｆｆ＿ｓｉｇｎ＿ｆｌａｇ、ａｂｓ＿ｌｅｖｅｌ＿ｇｔ１＿ｆｌａｇ、ｐａｒ＿ｌｅｖｅｌ＿ｆｌａｇを１つのパスで符号化する。第２の符号化パスでは、ａｂｓ＿ｌｅｖｅｌ＿ｇｔＸ＿ｆｌａｇを符号化する。ここで、Ｘは３、５、７、……であり得る。第３のパスでは、残りの係数レベルを符号化する。符号化パスが係数グループ（ＣｏｅｆｆｉｃｉｅｎｔＧｒｏｕｐ，ＣＧ）レベルで操作され、即ち各ＣＧごとに、３つの符号化パスが実行される。

【0026】

有効なスキャン位置はない。残余信号は予測後の空間残差を反映し、かつＴＳを対象に変換によるエネルギー圧縮は実行されないため、変換ブロックの右下隅に末尾ゼロまたは無意義なレベルが発生する高い確率が示されていない。したがって、この場合に、最後の有効なスキャン位置シグナリングは省略される。代わりに、処理対象となる第１のサブブロックは、変換ブロック内の右下隅にあるサブブロックである。

【0027】

次に、サブブロック符号化ブロックフラグ（ＣｏｄｉｎｇＢｌｏｃｋＦｌａｇ，ＣＢＦ）について説明する。最後の有効なスキャン位置シグナリングがない場合は、ＴＳのｃｏｄｅｄ＿ｓｕｂ＿ｂｌｏｃｋ＿ｆｌａｇ付きのサブブロックＣＢＦシグナリングを次のように変更する必要がある。

【0028】

量子化により、前述の無意義なシーケンスが変換ブロック内に部分的に発生する可能性がある。したがって、最後の有効なスキャン位置が前述のように削除され、すべてのサブブロックに対してｃｏｄｅｄ＿ｓｕｂ＿ｂｌｏｃｋ＿ｆｌａｇが符号化される。

【0029】

ＤＣ周波数位置をカバーするサブブロック（左上のサブブロック）のｃｏｄｅｄ＿ｓｕｂ＿ｂｌｏｃｋ＿ｆｌａｇは、特殊なケースとされている。ＶＶＣドラフト３では、このサブブロックのｃｏｄｅｄ＿ｓｕｂ＿ｂｌｏｃｋ＿ｆｌａｇは信号で通知されず、１に等しいものと推測される。最後の有効なスキャン位置が別のサブブロックにある場合、ＤＣサブブロック以外に少なくとも１つの有効なレベルが存在している。したがって、このサブブロックのｃｏｄｅｄ＿ｓｕｂ＿ｂｌｏｃｋ＿ｆｌａｇは１に等しいものと推測されるが、ＤＣサブブロックにはゼロ／有効でないレベルしか含まれない場合がある。ＴＳには、最後のスキャン位置情報がないから、各サブブロックのｃｏｄｅｄ＿ｓｕｂ＿ｂｌｏｃｋ＿ｆｌａｇが信号で通知される。これには、他のすべてのｃｏｄｅｄ＿ｓｕｂ＿ｂｌｏｃｋ＿ｆｌａｇ構文要素がすでに０に等しい場合を除き、ＤＣサブブロックのｃｏｄｅｄ＿ｓｕｂ＿ｂｌｏｃｋ＿ｆｌａｇも含まれている。この場合には、ＤＣｃｏｄｅｄ＿ｓｕｂ＿ｂｌｏｃｋ＿ｆｌａｇは１に等しいものと推測される（ｉｎｆｅｒＤｃＳｂＣｂｆ＝１）。このＤＣサブブロックには少なくとも１つの有効なレベルがあるため、（０，０）での第１の位置にあるｓｉｇ＿ｃｏｅｆｆ＿ｆｌａｇ構文要素は信号で通知されず、かつ当該ＤＣサブブロック内の他のすべてのｓｉｇ＿ｃｏｅｆｆ＿ｆｌａｇ構文要素が０に等しい場合、１に等しくなる（ｉｎｆｅｒＳｂＤｃＳｉｇＣｏｅｆｆＦｌａｇ＝１）と導出される。

【0030】

ｃｏｄｅｄ＿ｓｕｂ＿ｂｌｏｃｋ＿ｆｌａｇのコンテキストモデリングは変更できる。コンテキストモデルインデックスは、右側のｃｏｄｅｄ＿ｓｕｂ＿ｂｌｏｃｋ＿ｆｌａｇと、現在のサブブロックの下側のｃｏｄｅｄ＿ｓｕｂ＿ｂｌｏｃｋ＿ｆｌａｇの合計として計算できるが、両方の論理和ではない。

【0031】

以下で、ｓｉｇ＿ｃｏｅｆｆ＿ｆｌａｇコンテキストモデリングについて説明する。ｓｉｇ＿ｃｏｅｆｆ＿ｆｌａｇコンテキストモデリング内のローカルテンプレートは、現在のスキャン位置の右側のネイバー（ＮＢ_０）とその下側のネイバー（ＮＢ_１）のみを含むように変更できる。コンテキストモデルのオフセットは、有効な隣接位置の数ｓｉｇ＿ｃｏｅｆｆ＿ｆｌａｇ［ＮＢ０］＋ｓｉｇ＿ｃｏｅｆｆ＿ｆｌａｇ［ＮＢ１］を表す。したがって、異なるコンテキストの選択は、現在の変換ブロック内の対角線ｄに応じて設定される（ｄは削除される）。これにより、ｓｉｇ＿ｃｏｅｆｆ＿ｆｌａｇフラグをコーディングするための３つのコンテキストモデルと単一のコンテキストモデルセットが作成される。

【0032】

以下で、ａｂｓ＿ｌｅｖｅｌ＿ｇｔ１＿ｆｌａｇおよびｐａｒ＿ｌｅｖｅｌ＿ｆｌａｇコンテキストモデリングについて説明する。ａｂｓ＿ｌｅｖｅｌ＿ｇｔ１＿ｆｌａｇおよびｐａｒ＿ｌｅｖｅｌ＿ｆｌａｇには、単一のコンテキストモデルが採用されている。

【0033】

以下で、ａｂｓ＿ｒｅｍａｉｎｄｅｒコーディングについて説明する。変換スキップの残差絶対レベルの経験分布は、通常、ラプラシアン分布または幾何分布に適合するが、変換係数の絶対レベルよりも大きな不安定性が存在する場合がある。特に、残差絶対レベルに対して、連続実現のウィンドウ内の分散が高い。これにより、ａｂｓ＿ｒｅｍａｉｎｄｅｒ構文の２値化とコンテキストモデリングを次のように変更できる。

【0034】

二値化でより高いカットオフ値を使用する。つまり、ｓｉｇ＿ｃｏｅｆｆ＿ｆｌａｇ、ａｂｓ＿ｌｅｖｅｌ＿ｇｔ１＿ｆｌａｇ、ｐａｒ＿ｌｅｖｅｌ＿ｆｌａｇ、およびａｂｓ＿ｌｅｖｅｌ＿ｇｔ３＿ｆｌａｇを使用したコーディングからａｂｓ＿ｒｅｍａｉｎｄｅｒのライスコード（Ｒｉｃｅｃｏｄｅ）への遷移点、および各ビン（ｂｉｎ）位置の専用コンテキストモデルを使用すると、圧縮効率が高くなる。カットオフを大きくすると、カットオフに達するまで、ａｂｓ＿ｌｅｖｅｌ＿ｇｔ５＿ｆｌａｇ、ａｂｓ＿ｌｅｖｅｌ＿ｇｔ７＿ｆｌａｇなどを導入するなど、より多くの「Ｘより大きい」フラグが生成される。カットオフ自体は５に固定される（ｎｕｍＧｔＦｌａｇｓ＝５）。

【0035】

ｓｉｇ＿ｃｏｅｆｆ＿ｆｌａｇモデリングコンテキストのローカルテンプレートと同様に、ライスパラメータ（ｒｉｃｅｐａｒａｍｅｔｅｒ）導出のテンプレートを変更できる。つまり、現在のスキャン位置の左側にあるネイバーおよび下側にあるネイバーのみが考慮される。

【0036】

以下で、ｃｏｅｆｆ＿ｓｉｇｎ＿ｆｌａｇコンテキストモデリングについて説明する。符号シーケンス内部の不安定性と、予測残差がバイアスされることが多いという事実により、グローバルな経験分布がほぼ均一に分布している場合でも、コンテキストモデルを使用して記号を符号化できる。記号の符号化には単一の専用コンテキストモデルを使用でき、かつｓｉｇ＿ｃｏｅｆｆ＿ｆｌａｇの後に記号を解析してコンテキストで符号化されたすべてのバイナリ数をまとめることができる。

【0037】

以下で、コンテキスト符号化されたバイナリ数の制限について説明する。各変換ユニット（ＴｒａｎｓｆｏｒｍＵｎｉｔ，ＴＵ）ごとにコンテキスト符号化されたバイナリ数の総数は、ＴＵ領域サイズに２を掛けたものに制限される。例えば、１６×８ＴＵに対してコンテキスト符号化されたバイナリ数の最大数は１６×８×２＝２５６である。コンテキスト符号化されたバイナリ数のバジェットは、ＴＵレベルで消費される。つまり、ＣＧごとのコンテキスト符号化されたバイナリ数の個々のバジェットではなく、現在のＴＵ内のすべてのＣＧは、コンテキスト符号化されたバイナリ数の１つのバジェットを共有する。

【0038】

クロマ残差のジョイント符号化

【0039】

ＶＶＣドラフト６は、クロマ残差をジョイント符号化するモードをサポートする。ジョイントクロマ符号化モードの使用（アクティブ化）は、ＴＵレベルフラグｔｕ＿ｊｏｉｎｔ＿ｃｂｃｒ＿ｒｅｓｉｄｕａｌ＿ｆｌａｇによって示され、かつ選択されたモードは、クロマＣＢＦによって暗黙的に示される。ＴＵのクロマＣＢＦのいずれかまたは両方が１に等しい場合に、フラグｔｕ＿ｊｏｉｎｔ＿ｃｂｃｒ＿ｒｅｓｉｄｕａｌ＿ｆｌａｇは存在すると考えられる。ＰＰＳおよびスライスヘッダでは、通常のクロマ残差符号化モードに対して信号で通知されるクロマＱＰオフセット値と区別されるように、ジョイントクロマ残差符号化モードに対して、クロマ量子化パラメータ（ｑｕａｎｔｉｚａｔｉｏｎｐａｒａｍｅｔｅｒ，ＱＰ）オフセット値が信号で通知される。これらのクロマＱＰオフセット値は、ジョイントクロマ残差符号化モードによって符号化されたブロックのクロマＱＰ値を導出するために使用される。相応するジョイントクロマ符号化モード（表１のモード２）がＴＵにおいてアクティブな場合、そのＴＵの量子化および復号化期間中に、適用される輝度にクロマＱＰオフセットが追加されてクロマＱＰが得られる。他のモード（表１のモード１および３）の場合、クロマＱＰは、従来のＣｂまたはＣｒブロックの場合と同じ方法で導出される。送信された変換ブロックからのクロマ残差（ｒｅｓＣｂおよびｒｅｓＣｒ）の再構成プロセスを表１に示す。このモードがアクティブになると、１つの単一ジョイントクロマ残差ブロック（ｒｅｓＪｏｉｎｔＣ［ｘ］［ｙ］表１）に信号が送られ、Ｃｂの残差ブロック（ｒｅｓＣｂ）とＣｒの残差ブロック（ｒｅｓＣｒ）は、ｔｕ＿ｃｂｆ＿ｃｂ、ｔｕ＿ｃｂｆ＿ｃｒ、ＣＳｉｇｎ（スライスヘッダで指定された符号値）などの情報を考慮して導出される。

【0040】

上記の３つのジョイントクロマ符号化モードは、イントラコーディングされた符号化ユニット（ＣｏｄｉｎｇＵｎｉｔ，ＣＵ）でのみサポートされる。インターコーディングされたＣＵでは、モード２のみがサポートされる。従って、インターコーディングされたＣＵの場合、構文要素ｔｕ＿ｊｏｉｎｔ＿ｃｂｃｒ＿ｒｅｓｉｄｕａｌ＿ｆｌａｇは、両方のクロマｃｂｆｓがともに１に等しい場合のみに存在する。

【0041】

【表1】

【0042】

ここで、値ＣＳｉｇｎは、スライスヘッダで指定された記号値（＋１または－１）であり、ｒｅｓＪｏｉｎｔＣ［］［］は送信された残差である。

【0043】

ここで図２を参照すると、図２は実施形態による通信システム２００のブロック図である。通信システム２００は、ネットワーク２５０を介して相互接続された少なくとも２つの端末２１０および２２０を含み得る。データを一方向に送信する場合、第１の端末２１０は、ネットワーク２５０を介して第２の端末２２０に送信するためにデータをローカルロケーションで符号化することができる。第２の端末２２０は、ネットワーク２５０から第１の端末２１０の符号化されたデータを受信し、符号化データを復号し、復号されたデータを表示することができる。データの一方向送信は、メディアサービングアプリケーションなどで一般的であり得る。

【0044】

図２は、さらに、例えば、ビデオ会議中に発生する可能性がある符号化されたデータの双方向送信をサポートするために提供される端末２３０および２４０を示している。データの双方向送信の場合、各端末２３０または２４０は、ローカルロケーションで捕捉されたデータを符号化して、ネットワーク２５０を介して他の端末に送信することができる。各端末２３０または２４０はまた、他の端末によって送信された符号化されたデータを受信し、符号化されたデータを復号し、復号されたデータをローカル表示装置に表示することができる。

【0045】

図２では、端末２１０～２４０は、サーバー、パーソナルコンピュータおよびスマートフォンとして示され得るが、実施形態の原理は、これだけに限定されない。実施形態は、ラップトップコンピュータ、タブレットコンピュータ、メディアプレーヤーおよび／または専用ビデオ会議デバイスに適している。ネットワーク２５０は、例えば、有線および／または無線通信ネットワークを含む、端末２１０～２４０の間で符号化されたデータを送信する任意の数のネットワークを表す。通信ネットワーク２５０は、回路交換および／またはパケット交換チャネルでデータを交換することができる。代表的なネットワークとしては、電気通信ネットワーク、ローカルエリアネットワーク、ワイドエリアネットワーク、および／またはインターネットが挙げられる。本議論の目的のために、ネットワーク２５０のアーキテクチャおよびトポロジーは、本明細書で以下に説明しない限り、実施形態の動作にとって重要でない場合がある。

【0046】

図３は、実施形態による、環境におけるＧ－ＰＣＣコンプレッサ３０３およびＧ－ＰＣＣデコンプレッサ３１０の配置方式を示す図である。開示された主題は、例えば、ビデオ会議、デジタルＴＶ、ＣＤ、ＤＶＤ、メモリスティックなどのデジタルメディアへの圧縮データの保存など、他の搭載可能なアプリケーションに同等に適用可能である。

【0047】

ストリーミングシステム３００は、ソース３１０、例えば、デジタルカメラを含むことができ、例えば非圧縮データ３０２を作成することができるキャプチャサブシステム３１３を含み得る。データ量がより多いデータ３０２は、ソース３０１に結合されたＧ－ＰＣＣコンプレッサ３０３によって処理され得る。以下でより詳細に説明する開示された主題の態様を実現または実施することができるように、Ｇ－ＰＣＣコンプレッサ３０３は、ハードウェア、ソフトウェア、またはそれらの組み合わせを含み得る。後続の使用のために、データ量がより少ない符号化されたデータ３０４をストリーミングサーバ３０５に格納することができる。１つまたは複数のストリーミングクライアント３０６および３０８は、ストリーミングサーバ３０５にアクセスして、符号化されたデータ３０４のコピー３０７および３０９を検索することができる。クライアント端末３０６は、符号化されたデータの着信コピー３０７を復号し、ディスプレイ３１２または他の表示デバイス（図示されず）で表示できる発信データ３１１を作成するＧ－ＰＣＣデコンプレッサ３１０を含み得る。幾つかのストリーミングシステムでは、符号化されたデータ３０４、３０７および３０９を、ビデオコーディング／圧縮規格に従って符号化することができる。これらの規格の例には、Ｇ－ＰＣＣを対象にＭＰＥＧによって開発されたそれらの規格が含まれている。

【0048】

本開示の実施形態は、複数のカラー成分の変換係数に二次変換を共同で適用することができる。ここで提案されるジョイント変換スキームは、ジョイント成分の二次変換（ＪＣＳＴ）と呼ばれることができる。図４では、２つのカラー成分にＪＣＳＴを適用するエンコーダスキームが示される。ここで、ＪＣＳＴは、順方向変換の後、量子化の前に実行される。

【0049】

本開示の実施形態は、図５に示されるように、逆量子化変換の後、逆方向（逆）変換の前にＪＣＳＴを実行することができる。

【0050】

図９を参照すると、ＬＲＲＸが第１のブロック９０１にある。方法９００は、符号化されたカラー成分を含む符号化されたビデオビットストリームを取得するステップを含む。

【0051】

第２のブロック９０２において、方法９００は、符号化されたカラー成分をエントロピー解析するステップを含む。

【0052】

第３のブロック９０３において、方法９００は、カラー成分を非量子化し、カラー成分の変換係数を取得するステップを含む。

【0053】

第４のブロック９０４において、方法９００は、カラー成分の変換係数にジョイント成分二次変換（ＪＣＳＴ）を適用することによってＪＣＳＴ出力を生成するステップを含む。

【0054】

実施形態によれば、第５のブロック９０５が提供され得る。第５のブロック９０５において、方法９００は、ＪＣＳＴ出力に逆方向変換を実行することによって前記カラー成分の残差成分を求めるステップを含んでもよい。

【0055】

実施形態によれば、第６のブロック９０６が提供され得る。第６のブロック９０６において、方法９００は、カラー成分の残差成分に基づいて、符号化されたビデオビットストリームを復号化するステップを含んでもよい。

【0056】

実施形態によれば、この方法は、符号化方法として逆実行され得る。実際には、本明細書は、特定の符号化または復号化方案に言及し得るが、これらの説明は、特定の符号化または復号化方案に限定されるものではない。つまり、符号化方案と復号化方案の両方に同様に適用可能である。

【0057】

一実施形態では、ＪＣＳＴの入力は、ＣｂおよびＣｒ変換係数であり得る。

【0058】

別の実施形態では、ＪＣＳＴの入力は、Ｙ、Ｃｂ、及びＣｒ変換係数であり得る。

【0059】

一実施形態では、同じ座標に位置するＣｂおよびＣｒ変換係数の各対に対してＪＣＳＴが実行されるように、ＪＣＳＴは要素ごとに実行され得る。図６は、２つの４×２サイズのブロックに由来するＣｂおよびＣｒ変換係数の対を例示している。

【0060】

一実施形態では、ＪＣＳＴは２点変換であり得るし、入力は、同じ座標に位置するＣｂおよびＣｒ変換係数の対であり得る。

【0061】

一実施形態では、ＪＣＳＴは２点変換であり得るし、出力は、ＣｂおよびＣｒ変換係数の対を置き換える一対の二次変換係数であり得る。

【0062】

一実施形態では、ＣｂおよびＣｒ変換係数の出力対は、ＪＣＳＴの入力として使用されるＣｂおよびＣｒ変換係数対と同じ位置に配置され得る。図７は、２つの４×２サイズのＣｂおよびＣｒブロックに適用されるＪＣＳＴを例示している。さらに別の２つの４×２サイズのＣｂおよびＣｒブロックを構築するＪＣＳＴの出力は、エンコーダ／デコーダでさらに量子化／非量子化され、エントロピー符号化／解析される。

【0063】

一実施形態では、ＪＣＳＴの出力は、入力よりも少なくてもよい。例えば、入力は、１対のＣｂおよびＣｒ係数であり得る一方、出力は、ただ１つの二次変換係数のみであり得る。

【0064】

一実施形態では、ＪＣＳＴに適用される変換は、Ｈａｄａｍａｒｄ変換、離散コサイン／正弦変換およびＫＬＴやＬＧＴ（ライングラフ変換）などのデータ駆動型変換を含み得るが、必ずしもこれらに限定されるものではない。

【0065】

一実施形態では、ＪＣＳＴの入力は、異なる座標に位置する１対以上（例えば３対）の異なるカラー成分から由来することができる。

【0066】

一実施形態では、ＪＣＳＴは４点変換であり得るし、入力は、同じ座標に位置する２対のＣｂ及びＣｒ変換係数であり得る。例示は図８に示されている。

【0067】

一実施形態では、出力は、１対以上のＣｂ及びＣｒ変換係数を置き換える１対以上の二次変換係数であり得る。

【0068】

一実施形態では、ＪＣＳＴの出力は、入力よりも少なくてもよい。例えば、入力は、１対以上のＣｂ及びＣｒ係数であり得る一方、出力は、ただ２つの二次変換係数のみであり得る。

【0069】

【0070】

一実施形態では、ＪＣＳＴは、限りのある範囲内のブロックサイズに適用され得る。

【0071】

一例では、ＪＣＳＴは、所定の閾値以下のブロックサイズに適用され得る。ここでブロックサイズは、ブロック幅、ブロック高さ、ブロック領域サイズ、ブロック幅および高さ、およびブロック幅と高さの最大値（または最小値）を指すことができる。

【0072】

一例では、ＪＣＳＴは、所定の閾値以上のブロックサイズに適用され得る。ここでブロックサイズは、ブロック幅、ブロック高さ、ブロック領域サイズ、ブロック幅および高さ、およびブロック幅と高さの最大値（または最小値）を指すことができる。

【0073】

一実施形態では、ＪＣＳＴが適用されるかどうかは、変換ブロックレベルでＪＣＳＴフラグによって通知され得る。

【0074】

一実施形態では、ＪＣＳＴフラグは、変換係数の後に信号で通知され得る。

【0075】

一実施形態では、ＪＣＳＴフラグは、ＪＣＳＴを適用している少なくとも１つのカラー成分が少なくとも１つの非ゼロ係数を有する場合にのみ信号で通知され得る。

【0076】

一実施形態では、ＪＣＳＴフラグは、ＪＣＳＴを適用している各カラー成分が少なくとも１つの非ゼロ係数を有する場合にのみ通知される。

【0077】

一実施形態では、ＪＣＳＴフラグは、ＪＣＳＴを適用しているカラー成分の非ゼロ係数の総数が所定の閾値、例えば、０、１、２、３または４よりも大きい場合のみ信号で通知される。

【0078】

一実施形態では、ＪＣＳＴフラグは、ＪＣＳＴを適用しているカラー成分の最後の非ゼロ係数が、走査順序に沿って所定の閾値、例えば、０、１、２、３または４よりも大きい箇所に位置する場合にのみ通知される。

【0079】

一実施形態では、ＪＣＳＴが適用されるかどうかは、ＣＵレベル（またはＣＢレベル）でのＪＣＳＴフラグによって通知される。

【0080】

一実施形態では、ＪＣＳＴを適用できるかどうかは、高レベル構文を介して信号で通知される。高レベル構文は、ビデオパラメータセット（ＶｉｄｅｏＰａｒａｍｅｔｅｒＳｅｔ，ＶＰＳ）、シーケンスパラメータ設定（ＳｅｑｕｅｎｃｅＰａｒａｍｅｔｅｒＳｅｔｔｉｎｇ，ＳＰＳ）、画像パラメータセット（ＰｉｃｔｕｒｅＰａｒａｍｅｔｅｒＳｅｔ，ＰＰＳ）、スライスヘッダ、画像ヘッダ、タイル、タイルグループ、またはコーディングツリーユニット（ＣｏｄｉｎｇＴｒｅｅＵｎｉｔ，ＣＴＵ）レベルを含むが、これらに限定されるものではない。

【0081】

一実施形態では、ＪＣＳＴが適用される場合、一次変換は所定の変換タイプである。

【0082】

一例では、所定の変換タイプはＤＣＴ－２である。別の一例では、所定の変換タイプはＤＳＴ－７である。

【0083】

一実施形態では、ＪＣＳＴに適用される変換への選択は、符号化情報に決定される。ここで符号化情報は、一次変換タイプ、イントラ予測方向／角度などのイントラ予測モード、、インター予測モード、イントラブロックコピー（ＩｎｔｒａＢｌｏｃｋＣｏｐｙ，ＩｎｔｒａＢＣ）が適用されているかどうか、パレットモードが適用されているかどうか、ＤＰＣＭモードが適用されているかどうか、モーションベクトル情報（方向、大きさ）、サブブロックモーションが適用されているかどうか、ワープモーション（アフィンモーション）が適用されているかどうかを含むが、これらに限定されるものではない。

【0084】

一実施形態では、ＪＣＳＴが適用されるかどうかを示すフラグのエントロピー符号化に使用されるコンテキストは、隣接するブロックからの隣接ブロック情報に依存する。ここで隣接ブロック情報は、上記列挙された情報を含むがこれらに限定されない。

【0085】

上記の技術は、圧縮／解凍に適合したビデオエンコーダーおよび／またはデコーダーによって実現され得る。エンコーダーおよび／またはデコーダーは、ハードウェア、ソフトウェア、またはそれらの任意の組み合わせで実現され、かつソフトウェアがある場合は、１つまたは複数の非一時的なコンピュータ可読媒体に格納されてもよい。例えば、方法（または実施形態）、エンコーダ、およびデコーダのそれぞれは、処理回路システム（例えば、１つまたは複数のプロセッサまたは１つまたは複数の集積回路）によって実装され得る。一例では、１つまたは複数のプロセッサは、非一時的なコンピュータ可読媒体に格納されているプログラムを実行する。

【0086】

上記の技術は、コンピュータ可読命令を使用してコンピュータソフトウェアとして実現され、１つまたは複数のコンピュータ可読媒体に物理的に格納され得る。例えば、図１０は、本開示の幾つかの実施形態を実施するのに適したコンピュータシステム９００を示す。

【0087】

コンピュータソフトウェアは、任意の適切な機械コードまたはコンピュータ言語を使用してコード化することができ、任意の適切な機械コードまたはコンピュータ言語に対して、コンピュータ中央処理装置（ＣＰＵ）、グラフィックス処理装置（ＧＰＵ）などによって直接に実行され、または解釈、マイクロコード実行などを介して実行され得る命令を含むコードを作成するためのアセンブリ、コンパイル、リンクなどのメカニズムを行うことができる。

【0088】

命令は、例えば、パーソナルコンピュータ、タブレットコンピュータ、サーバ、スマートフォン、ゲーム装置、モノのインターネット装置などを含む、様々なタイプのコンピュータまたはその部品で実行され得る。

【0089】

図１０に示されるコンピュータシステム９００のための部品は例示的なものであり、本開示の実施形態を実施するコンピュータソフトウェアの使用範囲または機能範囲を制限することを意図されるものではない。部品の配置は、コンピュータシステム９００の非限定的な実施形態に示される部品のいずれか１つまたは部品の組み合わせに関連する依存性または要件を有するものとして解釈されるべきでもない。

【0090】

コンピュータシステム９００は、特定のヒューマンインターフェース入力デバイスを含み得る。このようなヒューマンインターフェース入力デバイスは、例えば、１人または複数の人間ユーザーが触覚入力（例えば、キーストローク、スワイプ、データグローブの動きなど）、音声入力（例えば音声、拍手など）、視覚入力（例えばジェスチャーなど）、嗅覚入力（図示せず）を通じた入力に応答し得る。ヒューマンインターフェイスデバイスを使用して、人間による意識的な入力に必ずしも直接関連するとは限らない幾つかのメディア、例えばオーディオ（音声、音楽、周囲の音など）、画像（スキャン画像、静止画像カメラから撮像した写真画像など）、ビデオ（２次元ビデオ、立体ビデオを含む３次元ビデオなど）を捕捉することもできる。

【0091】

入力用ヒューマンインターフェースデバイスは、キーボード９０１、マウス９０２、トラックパッド９０３、タッチスクリーン９１０、データグローブ、ジョイスティック９０５、マイク９０６、スキャナ９０７、カメラ９０８のうちの１つまたは複数（各アイテムに１つしか描かれていない）を含み得る。

【0092】

コンピュータシステム９００はまた、特定のヒューマンインターフェース出力デバイスを含み得る。このようなヒューマンインターフェース出力デバイスは、例えば、触覚出力、音、光、および匂い／味を通して、１人または複数の人間ユーザーの感覚を刺激し得る。このようなヒューマンインターフェース出力デバイスは、触覚出力デバイス（例えば、タッチスクリーン９１０、データグローブ、またはジョイスティック９０５による触覚フィードバックがあり得るが、入力デバイスとして機能しない触覚フィードバックデバイスもあり得る）を含み得る。例えば、このようなデバイスは、音声出力デバイス（スピーカー９０９、ヘッドホン（図示せず）など）、視覚出力デバイス（カソードレイチューブ（ｃａｔｈｏｄｅｒａｙｔｕｂｅ，ＣＲＴ）スクリーン、液晶ディスプレイ（ｌｉｑｕｉｄｃｒｙｓｔａｌｄｉｓｐｌａｙ，ＬＣＤ）スクリーン、プラズマスクリーン、有機発光ダイオード（ｏｒｇａｎｉｃｌｉｇｈｔ－ｅｍｉｔｔｉｎｇｄｉｏｄｅ，ＯＬＥＤ）スクリーンを含むスクリーン９１０など、それぞれタッチスクリーン入力機能の有無にかかわらず、それぞれ触覚フィードバック機能の有無にかかわらず、その一部はステレオグラフィック出力の方式によって２次元視覚出力または３次元以上出力を出力できる場合がある）、仮想現実ガラス（図示せず）、ホログラフィックディスプレイ及びスモークタンク（図示せず）を含む）、およびプリンタ（図示せず）であり得る。

【0093】

コンピュータシステム９００はまた、人間がアクセス可能な記憶装置およびそれらに関連する媒体、例えば、ＣＤ／ＤＶＤなどの媒体９２１を有するＲＯＭ／ＲＷ９２０を含む光学媒体、サムドライブ９２２、リムーバブルハードドライブまたはソリッドステートドライブ９２３、例えばテープやフロッピーディスク（図示せず）などのレガシー磁気メディア、セキュリティドングル（図示せず）などの専用なＲＯＭ／ＡＳＩＣ／ＰＬＤベースのデバイスなどを含むことができる。

【0094】

また、現在開示されている主題に関連して使用される「コンピュータ可読媒体」という用語は、伝送媒体、搬送波、または他の一時的な信号を含まないことは、当業者に理解されるべきであろう。

【0095】

コンピュータシステム９００はまた、１つまたは複数の通信ネットワークへのインターフェースを含むことができる。ネットワークは、例えば、無線、有線、光であり得る。ネットワークは、さらに、ローカル、広域、メトロポリタン、車両および産業、リアルタイム、遅延耐性などであり得る。ネットワークの例には、イーサネットなどのローカルエリアネットワーク、ワイヤレスＬＡＮ、ＧＳＭ、３Ｇ、４Ｇ、５Ｇ、ＬＴＥなどを含むセルラーネットワーク、ケーブルテレビ、衛星テレビ、地上波放送テレビを含むテレビ有線またはワイヤレス広域デジタルネットワーク、ＣＡＮＢｕｓなどを含む車両および産業用などが含まれる。特定のネットワークは、通常、特定の汎用データポートまたは周辺バス９４９（たとえば、コンピュータシステム９００のＵＳＢポートなど）に接続された外部ネットワークインターフェイスアダプタを必要とする。他のネットワークは、一般に、以下に説明するシステムバス（例えば、ＰＣコンピュータシステムへのイーサネットインターフェースまたはのセルラーネットワークインターフェース）に接続することによってコンピュータシステム９００のコアに統合される。これらのネットワークのいずれかを使用すると、コンピュータシステム９００は、他のエンティティと通信することができる。このような通信は、単方向受信のみ（例えば、放送テレビ）、単方向送信のみ（例えば、特定のＣＡＮｂｕｓデバイスのＣＡＮｂｕｓへ）、または双方向（例えば、ローカルまたはワイドエリアデジタルネットワークを使用して他のコンピュータシステムへ）であってもよい。このような通信には、クラウドコンピューティング環境９５５への通信が含まれる。特定のプロトコル及びプロトコルスタックは、上記のようなネットワークまたはネットワークインターフェイスのそれぞれに使用され得る。

【0096】

前述のヒューマンインターフェースデバイス、ヒューマンアクセス可能なストレージデバイス、およびネットワークインターフェース９５４は、コンピュータシステム９００のコア９４０に接続することができる。

【0097】

コア９４０は、１つまたは複数の中央処理装置（ＣＰＵ）９４１、グラフィックス処理装置（ＧＰＵ）９４２、フィールドプログラマブルゲートエリア（ＦＰＧＡ）９４３の形式の専用なプログラム処理装置、特定のタスク用のハードウェアアクセラレータ９４４などを含み得る。これらのデバイスは、読み取り専用メモリ（ＲＯＭ）９４５、ランダムアクセスメモリ９４６、ユーザーがアクセスできない内部ハードドライブ、ＳＳＤなどの内部大容量ストレージ９４７とともに、システムバス９４８を介して接続され得る。一部のコンピュータシステムでは、システムバス９４８に１つまたは複数の物理プラグの形でアクセスして、付設のＣＰＵ、ＧＰＵなどによる拡張可能である。周辺機器は、直接的に、または周辺バス９４９を介してコアのシステムバス９４８に接続できる。周辺バスのアーキテクチャには、ＰＣＩ、ＵＳＢなどが含まれる。グラフィックアダプタ９５０コア９４０に含めることができる。

【0098】

ＣＰＵ９４１、ＧＰＵ９４２、ＦＰＧＡ９４３、およびアクセラレータ９４４は、組み合わせて前述のコンピュータコードを構成できる特定の命令を実行できる。このコンピュータコードは、ＲＯＭ９４５またはＲＡＭ９４６に格納され得る。遷移データはＲＡＭ９４６にも格納され得る。また永久データは、例えば内部大容量記憶装置９４７に格納され得る。１つまたは複数のＣＰＵ９４１、ＧＰＵ９４２、大容量ストレージ９４７、ＲＯＭ９４５、ＲＡＭ９４６などと密接に関連付けることができるキャッシュメモリを使用することにより、任意のメモリデバイスへの高速記憶および検索を可能にすることができる。

【0099】

コンピュータ可読媒体は、様々なコンピュータによる操作を実行するためのコンピュータコードを有する場合がある。媒体およびコンピュータコードは、本開示の目的のために特別に設計および構築されたもの、またはコンピュータソフトウェア分野の業者に周知されかつ利用されることが可能な種類のものであり得る。

【0100】

一例として、限定ではなく、アーキテクチャを有するコンピュータシステム９００、特にコア９４０は、１つまたは複数の有形のコンピュータ可読媒体に具体化されたソフトウェアを実行するプロセッサ（ＣＰＵ、ＧＰＵ、ＦＰＧＡ、アクセラレータなどを含む）の結果として機能を提供することができる。このようなコンピュータ可読媒体は、上記で紹介したように、ユーザがアクセス可能な大容量記憶装置、ならびにコア９４０などの非一時的な性質を有する特定の記憶装置、例えばコア内部の大容量記憶装置９４７やＲＯＭ９４５などに関連する媒体であり得る。本開示の様々な実施形態を実現するソフトウェアは、そのようなデバイスに格納され、コア９４０によって実行され得る。コンピュータ可読媒体は、特定の必要性に応じて、１つまたは複数の記憶装置またはチップを含み得る。ソフトウェアは、コア９４０、特にその中のプロセッサ（ＣＰＵ、ＧＰＵ、ＦＰＧＡなどを含む）に、本明細書に記載の特定の処理または特定の処理の特定の部分を実行させることができるが、ＲＡＭ９４６に格納されたデータ構造への限定、およびソフトウェアによって限定された処理に従ってこれらのデータ構造への変更を含む。さらに、または代替として、コンピュータシステムは、配線されたロジックまたは回路（例えば、アクセラレータ９４４）に組み込まれたロジックの結果として機能を提供でき、のロジックは、ソフトウェアの代わりに、またはソフトウェアと一緒に動作して、本明細書に記載の特定の処理または特定の処理の特定の部分を実行することができる。必要に応じて、係るソフトウェーアはロジックを包含する場合があり、逆に、係るロジックはソフトウェーアを包含する場合もある。必要に応じて、係るコンピュータ可読媒体は、実行用のソフトウェアを格納する回路（集積回路（ＩＣ）など）、実行用のロジックを具体化する回路、またはその両方を包含する場合がある。本開示は、ハードウェアとソフトウェアの任意の適切な組み合わせを含む。

【0101】

本開示は、いくつかの非限定的な実施形態について説明しているが、本開示の範囲内に該当する変更、置換、および様々な代替同等物が存在している。したがって、本明細書に明示的に示されていないかまたは記載されていないが、当業者は開示の原理を具体化し、したがってその精神および範囲内にある多くのシステムおよび方法を考案することができることは理解されるべきであろう。

【0102】

ＡＬＦ：アダプティブループフィルタ
ＡＰＳ：適応パラメータセット
ＡＶ１：ＡＯＭｅｄｉａビデオ１
ＡＶ２：ＡＯＭｅｄｉａビデオ２
ＣＢ：符号化ブロック
ＣＣ－ＡＬＦ：クロスコンポーネントアダプティブループフィルタ
ＣＤＥＦ：制約付き指向性エンハンスメントフィルタ
ＣＵ：符号化ユニット、
ＣＴＵ：コーディングツリーユニット
ＤＰＣＭ：差分パルス符号化変調
ＤＰＳ：復号パラメータセット
ＨＤＲ：高ダイナミックレンジ
ＨＥＶＣ：高効率ビデオ符号化
ＩＳＰ：イントラサブパーティション
ＪＣＣＴ：ジョイントクロマコンポーネント変換
ＪＶＥＴ：ジョイントビデオ探索チーム
ＬＲ：ループ復元フィルタ
ＰＤＰＣ：位置依存予測組み合わせ
ＰＰＳ：画像パラメータセット
ＰＵ：予測ユニット
ＳＤＲ：標準ダイナミックレンジ
ＳＰＳ：シーケンスパラメータ設定
ＴＳＭ：変換スキップモード
ＴＵ：変換ユニット
ＶＶＣ：汎用ビデオ符号化
ＷＡＩＰ：広角イントラ予測
ＶＰＳ：ビデオパラメータセット

【符号の説明】

【0103】

９４４加速器
９４８システムバス
９５０グラフィックアダプタ
９５４ネットワークインターフェース

【図1】