IP Force 特許公報掲載プロジェクト 2022.1.31 β版

知財求人 - 知財ポータルサイト「IP Force」

▶ クゥアルコム・インコーポレイテッドの特許一覧

特許7265032ビデオコーディングについての最後の位置コーディングに対するコンテキスト導出
<>
  • 特許-ビデオコーディングについての最後の位置コーディングに対するコンテキスト導出 図1
  • 特許-ビデオコーディングについての最後の位置コーディングに対するコンテキスト導出 図2
  • 特許-ビデオコーディングについての最後の位置コーディングに対するコンテキスト導出 図3
  • 特許-ビデオコーディングについての最後の位置コーディングに対するコンテキスト導出 図4
  • 特許-ビデオコーディングについての最後の位置コーディングに対するコンテキスト導出 図5
  • 特許-ビデオコーディングについての最後の位置コーディングに対するコンテキスト導出 図6
  • 特許-ビデオコーディングについての最後の位置コーディングに対するコンテキスト導出 図7
< >
(19)【発行国】日本国特許庁(JP)
(12)【公報種別】特許公報(B2)
(11)【特許番号】
(24)【登録日】2023-04-17
(45)【発行日】2023-04-25
(54)【発明の名称】ビデオコーディングについての最後の位置コーディングに対するコンテキスト導出
(51)【国際特許分類】
   H04N 19/13 20140101AFI20230418BHJP
   H04N 19/157 20140101ALI20230418BHJP
   H04N 19/176 20140101ALI20230418BHJP
   H04N 19/70 20140101ALI20230418BHJP
【FI】
H04N19/13
H04N19/157
H04N19/176
H04N19/70
【請求項の数】 30
(21)【出願番号】P 2021557399
(86)(22)【出願日】2020-04-01
(65)【公表番号】
(43)【公表日】2022-04-28
(86)【国際出願番号】 US2020026146
(87)【国際公開番号】W WO2020205954
(87)【国際公開日】2020-10-08
【審査請求日】2022-02-28
(31)【優先権主張番号】62/828,266
(32)【優先日】2019-04-02
(33)【優先権主張国・地域又は機関】US
(31)【優先権主張番号】16/836,033
(32)【優先日】2020-03-31
(33)【優先権主張国・地域又は機関】US
【早期審査対象出願】
(73)【特許権者】
【識別番号】595020643
【氏名又は名称】クゥアルコム・インコーポレイテッド
【氏名又は名称原語表記】QUALCOMM INCORPORATED
(74)【代理人】
【識別番号】110003708
【氏名又は名称】弁理士法人鈴榮特許綜合事務所
(74)【代理人】
【識別番号】100108855
【弁理士】
【氏名又は名称】蔵田 昌俊
(74)【代理人】
【識別番号】100158805
【弁理士】
【氏名又は名称】井関 守三
(74)【代理人】
【識別番号】100112807
【弁理士】
【氏名又は名称】岡田 貴志
(72)【発明者】
【氏名】ルサノフスキー、ドミトロ
(72)【発明者】
【氏名】ルーズ、ケビン・パスカル・アンドレ
(72)【発明者】
【氏名】カルチェビチ、マルタ
【審査官】坂東 大五郎
(56)【参考文献】
【文献】Mohammed Golam Sarwer et al.,CE7-related: Context modeling of the position of last significant coefficient coding,Joint Video Experts Team (JVET),2018年10月06日,[JVET-L0096-v1] (version 3)
【文献】Benjamin Bross et al.,Versatile Video Coding (Draft 4),Joint Video Experts Team (JVET),2019年03月17日,pp.282-283,[JVET-M1001-v7] (version 7)
(58)【調査した分野】(Int.Cl.,DB名)
H04N 19/00-19/98
(57)【特許請求の範囲】
【請求項1】
ビデオデータをデコードする方法において、
ビデオデータの現在ブロックに対するエントロピーコード化データを受信することと、前記エントロピーコード化データは、前記現在ブロックに対する変換ブロック中の最後の有意係数の位置を示すシンタックス要素に対するエントロピーコード化データを含み、
前記変換ブロックのサイズの関数を使用して、前記最後の有意係数の前記位置を示す前記シンタックス要素に対する前記エントロピーコード化データの1つ以上のビンのそれぞれに対するそれぞれのコンテキストを決定することと、32サンプル寸法変換ブロックに対して64サンプル寸法変換ブロックに対して使用される同じコンテキストが使用されないように、前記関数は、前記それぞれのコンテキストを出力し、
前記決定されたそれぞれのコンテキストを使用して、前記最後の有意係数の前記位置を示す前記シンタックス要素に対する前記エントロピーコード化データをデコードすることと、を含み、
前記関数は、コンテキストオフセットを決定するための導出関数を備え、
前記変換ブロックが32以下の寸法を有するとき、前記導出関数は、スケールおよびオフセットから前記コンテキストオフセットを決定し、
前記変換ブロックが32より大きい寸法を有するとき、前記導出関数は、前記スケールと、前記オフセットと、異なるサイズの変換ブロックに対し同じでないコンテキストを決定するためのサイズ依存オフセットと、から前記コンテキストオフセットを決定し、前記サイズ依存オフセットは、前記変換ブロックの前記サイズに対するビットシフトとクリッピングとを有する、方法。
【請求項2】
前記現在ブロックに対する前記変換ブロックが、64サンプル寸法変換ブロックであり、前記導出関数は、線形演算と非線形演算とを含む請求項1記載の方法。
【請求項3】
前記非線形演算が、ビットシフトとクリッピングとを有する前記サイズ依存オフセットを含む請求項2記載の方法。
【請求項4】
前記現在ブロックに対する前記変換ブロックが、64サンプル寸法変換ブロックであり、前記変換ブロックのサイズの前記関数を使用して、前記最後の有意係数の前記位置を示す前記シンタックス要素に対する前記エントロピーコード化データの前記1つ以上のビンのそれぞれに対する前記それぞれのコンテキストを決定することは、
前記64サンプル寸法変換ブロックに対する第1の関数を使用して、前記最後の有意係数の前記位置を示す前記シンタックス要素に対する前記エントロピーコード化データの前記1つ以上のビンのそれぞれに対する前記それぞれのコンテキストを決定し、前記第1の関数は、32サンプル寸法変換ブロックに対する最後の有意係数の位置を示すシンタックス要素に対するエントロピーコード化データの1つ以上のビンのそれぞれに対するそれぞれのコンテキストを決定するのに使用される第2の関数とは異なることを含む請求項1記載の方法。
【請求項5】
前記変換ブロックのサイズの前記関数を使用して、前記最後の有意係数の前記位置を示す前記シンタックス要素に対する前記エントロピーコード化データの前記1つ以上のビンのそれぞれに対する前記それぞれのコンテキストを決定することは、
前記変換ブロックの前記サイズの前記関数と色成分インデックスとを使用して、それぞれのコンテキストオフセットとそれぞれのコンテキストシフトとを決定することと、
それぞれのビンに対するビンインデックスと、前記それぞれのコンテキストオフセットと、前記それぞれのコンテキストシフトとを使用して、前記1つ以上のビンの前記それぞれのビンに対する前記それぞれのコンテキストを決定することとを含む請求項1記載の方法。
【請求項6】
前記シンタックス要素が、前記最後の有意係数の前記位置のX位置を示す第1のプレフィックスシンタックス要素、または、前記最後の有意係数の前記位置のY位置を示す第2のプレフィックスシンタックス要素のうちの1つであり、前記決定されたそれぞれのコンテキストを使用して、前記最後の有意係数の前記位置を示す前記シンタックス要素に対する前記エントロピーコード化データをデコードすることは、
前記決定されたそれぞれのコンテキストを使用して、前記第1のプレフィックスシンタックス要素または前記第2のプレフィックスシンタックス要素に対する前記エントロピーコード化データをデコードすることを含む請求項1記載の方法。
【請求項7】
固定長デコーディングを使用して、第1のサフィックスシンタックス要素をデコードすることと、
前記最後の有意係数の前記位置を取得するために、前記第1のプレフィックスシンタックス要素と前記第1のサフィックスシンタックス要素とを逆バイナリ化することと、をさらに含む請求項6記載の方法。
【請求項8】
前記現在ブロックに対する前記変換ブロックが、128サンプル寸法変換ブロックであり、前記変換ブロックのサイズの前記関数を使用して、前記最後の有意係数の前記位置を示す前記シンタックス要素に対する前記エントロピーコード化データの前記1つ以上のビンのそれぞれに対する前記それぞれのコンテキストを決定することは、
前記128サンプル寸法変換ブロックに対する第1の関数を使用して、前記最後の有意係数の前記位置を示す前記シンタックス要素に対する前記エントロピーコード化データの前記1つ以上のビンのそれぞれに対する前記それぞれのコンテキストを決定し、前記第1の関数は、64サンプル寸法変換ブロックに対する最後の有意係数の位置を示すシンタックス要素に対するエントロピーコード化データの1つ以上のビンのそれぞれに対するそれぞれのコンテキストを決定するのに使用される第2の関数とは異なり、前記第1の関数は、32サンプル寸法変換ブロックに対する最後の有意係数の位置を示すシンタックス要素に対するエントロピーコード化データの1つ以上のビンのそれぞれに対するそれぞれのコンテキストを決定するのに使用される第3の関数とは異なる請求項1記載の方法。
【請求項9】
前記最後の有意係数の前記位置に基づいて、前記変換ブロックをデコードして、変換係数を取得することと、
前記変換係数に逆変換を適用して、残差ブロックを取得することと、
前記現在ブロックに対する予測プロセスを実行して、予測ブロックを取得することと、
前記残差ブロックを前記予測ブロックに加算して、ビデオデータのデコードされたブロックを取得することとをさらに含む請求項1記載の方法。
【請求項10】
前記ビデオデータのデコードされたブロックを含むピクチャーを表示することをさらに含む請求項9記載の方法。
【請求項11】
ビデオデータをデコードするように構成されている装置において、
ビデオデータの現在ブロックを記憶するように構成されているメモリと、
前記メモリと通信する1つ以上のプロセッサとを具備し、
前記1つ以上のプロセッサは、
前記ビデオデータの現在ブロックに対するエントロピーコード化データを受信することと、前記エントロピーコード化データは、前記現在ブロックに対する変換ブロック中の最後の有意係数の位置を示すシンタックス要素に対するエントロピーコード化データを含み、
前記変換ブロックのサイズの関数を使用して、前記最後の有意係数の前記位置を示す前記シンタックス要素に対する前記エントロピーコード化データの1つ以上のビンのそれぞれに対するそれぞれのコンテキストを決定することと、32サンプル寸法変換ブロックに対して64サンプル寸法変換ブロックに対して使用される同じコンテキストが使用されないように、前記関数は、前記それぞれのコンテキストを出力し、
前記決定されたそれぞれのコンテキストを使用して、前記最後の有意係数の前記位置を示す前記シンタックス要素に対する前記エントロピーコード化データをデコードすることと、
を行うように構成され、
前記関数は、コンテキストオフセットを決定するための導出関数を備え、
前記変換ブロックが32以下の寸法を有するとき、前記導出関数は、スケールおよびオフセットから前記コンテキストオフセットを決定し、
前記変換ブロックが32より大きい寸法を有するとき、前記導出関数は、前記スケールと、前記オフセットと、異なるサイズの変換ブロックに対し同じでないコンテキストを決定するためのサイズ依存オフセットと、から前記オフセットを決定し、前記サイズ依存オフセットは、前記変換ブロックの前記サイズに対するビットシフトとクリッピングとを有する、装置。
【請求項12】
前記現在ブロックに対する前記変換ブロックが、64サンプル寸法変換ブロックであり、前記導出関数は、線形演算と非線形演算とを含む請求項11記載の装置。
【請求項13】
前記非線形演算が、ビットシフトとクリッピングとを有する前記サイズ依存オフセットを含む請求項12記載の装置。
【請求項14】
前記現在ブロックに対する前記変換ブロックが、64サンプル寸法変換ブロックであり、前記変換ブロックのサイズの前記関数を使用して、前記最後の有意係数の前記位置を示す前記シンタックス要素に対する前記エントロピーコード化データの前記1つ以上のビンのそれぞれに対する前記それぞれのコンテキストを決定するために、前記1つ以上のプロセッサは、
前記64サンプル寸法変換ブロックに対する第1の関数を使用して、前記最後の有意係数の前記位置を示す前記シンタックス要素に対する前記エントロピーコード化データの前記1つ以上のビンのそれぞれに対する前記それぞれのコンテキストを決定し、前記第1の関数は、32サンプル寸法変換ブロックに対する最後の有意係数の位置を示すシンタックス要素に対するエントロピーコード化データの1つ以上のビンのそれぞれに対するそれぞれのコンテキストを決定するのに使用される第2の関数とは異なるようにさらに構成されている請求項11記載の装置。
【請求項15】
前記変換ブロックのサイズの前記関数を使用して、前記最後の有意係数の前記位置を示す前記シンタックス要素に対する前記エントロピーコード化データの前記1つ以上のビンのそれぞれに対する前記それぞれのコンテキストを決定するために、前記1つ以上のプロセッサは、
前記変換ブロックの前記サイズの前記関数と色成分インデックスとを使用して、それぞれのコンテキストオフセットとそれぞれのコンテキストシフトとを決定することと、
それぞれのビンに対するビンインデックスと、前記それぞれのコンテキストオフセットと、前記それぞれのコンテキストシフトとを使用して、前記1つ以上のビンの前記それぞれのビンに対する前記それぞれのコンテキストを決定することと、
を行うようにさらに構成されている請求項11記載の装置。
【請求項16】
前記シンタックス要素が、前記最後の有意係数の前記位置のX位置を示す第1のプレフィックスシンタックス要素、または、前記最後の有意係数の前記位置のY位置を示す第2のプレフィックスシンタックス要素のうちの1つであり、前記決定されたそれぞれのコンテキストを使用して、前記最後の有意係数の前記位置を示す前記シンタックス要素に対する前記エントロピーコード化データをデコードするために、前記1つ以上のプロセッサは、
前記決定されたそれぞれのコンテキストを使用して、前記第1のプレフィックスシンタックス要素または前記第2のプレフィックスシンタックス要素に対する前記エントロピーコード化データをデコードするようにさらに構成されている請求項11記載の装置。
【請求項17】
前記1つ以上のプロセッサは、
固定長デコーディングを使用して、第1のサフィックスシンタックス要素をデコードすることと、
前記最後の有意係数の前記位置を取得するために、前記第1のプレフィックスシンタックス要素と前記第1のサフィックスシンタックス要素とを逆バイナリ化することと、
を行うようにさらに構成されている請求項16記載の装置。
【請求項18】
前記現在ブロックに対する前記変換ブロックが、128サンプル寸法変換ブロックであり、前記変換ブロックのサイズの前記関数を使用して、前記最後の有意係数の前記位置を示す前記シンタックス要素に対する前記エントロピーコード化データの前記1つ以上のビンのそれぞれに対する前記それぞれのコンテキストを決定するために、前記1つ以上のプロセッサは、
前記128サンプル寸法変換ブロックに対する第1の関数を使用して、前記最後の有意係数の前記位置を示す前記シンタックス要素に対する前記エントロピーコード化データの前記1つ以上のビンのそれぞれに対する前記それぞれのコンテキストを決定し、前記第1の関数は、64サンプル寸法変換ブロックに対する最後の有意係数の位置を示すシンタックス要素に対するエントロピーコード化データの1つ以上のビンのそれぞれに対するそれぞれのコンテキストを決定するのに使用される第2の関数とは異なり、前記第1の関数は、32サンプル寸法変換ブロックに対する最後の有意係数の位置を示すシンタックス要素に対するエントロピーコード化データの1つ以上のビンのそれぞれに対するそれぞれのコンテキストを決定するのに使用される第3の関数とは異なるようにさらに構成されている請求項11記載の装置。
【請求項19】
前記1つ以上のプロセッサは、
前記最後の有意係数の前記位置に基づいて、前記変換ブロックをデコードして、変換係数を取得することと、
前記変換係数に逆変換を適用して、残差ブロックを取得することと、
前記現在ブロックに対する予測プロセスを実行して、予測ブロックを取得することと、
前記残差ブロックを前記予測ブロックに加算して、ビデオデータのデコードされたブロックを取得することと、
を行うようにさらに構成されている請求項11記載の装置。
【請求項20】
前記ビデオデータのデコードされたブロックを含むピクチャーを表示するように構成されているディスプレイをさらに具備する請求項19記載の装置。
【請求項21】
前記装置は、ワイヤレス通信デバイスである請求項11記載の装置。
【請求項22】
命令を記憶している非一時的コンピュータ読取可能記憶媒体において、
前記命令は、実行されるときに、ビデオデータをデコードするように構成されているデバイスの1つ以上のプロセッサに、
ビデオデータの現在ブロックに対するエントロピーコード化データを受信することと、前記エントロピーコード化データは、前記現在ブロックに対する変換ブロック中の最後の有意係数の位置を示すシンタックス要素に対するエントロピーコード化データを含み、
前記変換ブロックのサイズの関数を使用して、前記最後の有意係数の前記位置を示す前記シンタックス要素に対する前記エントロピーコード化データの1つ以上のビンのそれぞれに対するそれぞれのコンテキストを決定することと、32サンプル寸法変換ブロックに対して64サンプル寸法変換ブロックに対して使用される同じコンテキストが使用されないように、前記関数は、前記それぞれのコンテキストを出力し、
前記決定されたそれぞれのコンテキストを使用して、前記最後の有意係数の前記位置を示す前記シンタックス要素に対する前記エントロピーコード化データをデコードすることと、
を行わせ、
前記関数は、コンテキストオフセットを決定するための導出関数を備え、
前記変換ブロックが32以下の寸法を有するとき、前記導出関数は、スケールおよびオフセットから前記コンテキストオフセットを決定し、
前記変換ブロックが32より大きい寸法を有するとき、前記導出関数は、前記スケールと、前記オフセットと、異なるサイズの変換ブロックに対し同じでないコンテキストを決定するためのサイズ依存オフセットと、から前記オフセットを決定し、前記サイズ依存オフセットは、前記変換ブロックの前記サイズに対するビットシフトとクリッピングとを有する、非一時的コンピュータ読取可能記憶媒体。
【請求項23】
前記現在ブロックに対する前記変換ブロックが、64サンプル寸法変換ブロックであり、前記導出関数は、線形演算と非線形演算とを含む請求項22記載の非一時的コンピュータ読取可能記憶媒体。
【請求項24】
前記非線形演算が、ビットシフトとクリッピングとを有する前記サイズ依存オフセットを含む請求項23記載の非一時的コンピュータ読取可能記憶媒体。
【請求項25】
前記現在ブロックに対する前記変換ブロックが、64サンプル寸法変換ブロックであり、前記変換ブロックのサイズの前記関数を使用して、前記最後の有意係数の前記位置を示す前記シンタックス要素に対する前記エントロピーコード化データの前記1つ以上のビンのそれぞれに対する前記それぞれのコンテキストを決定するために、前記命令は、前記1つ以上のプロセッサに、さらに、
前記64サンプル寸法変換ブロックに対する第1の関数を使用して、前記最後の有意係数の前記位置を示す前記シンタックス要素に対する前記エントロピーコード化データの前記1つ以上のビンのそれぞれに対する前記それぞれのコンテキストを決定することを行わせ、前記第1の関数は、32サンプル寸法変換ブロックに対する最後の有意係数の位置を示すシンタックス要素に対するエントロピーコード化データの1つ以上のビンのそれぞれに対するそれぞれのコンテキストを決定するのに使用される第2の関数とは異なる、
請求項22記載の非一時的コンピュータ読取可能記憶媒体。
【請求項26】
前記変換ブロックのサイズの前記関数を使用して、前記最後の有意係数の前記位置を示す前記シンタックス要素に対する前記エントロピーコード化データの前記1つ以上のビンのそれぞれに対する前記それぞれのコンテキストを決定するために、前記命令は、前記1つ以上のプロセッサに、さらに、
前記変換ブロックの前記サイズの前記関数と色成分インデックスとを使用して、それぞれのコンテキストオフセットとそれぞれのコンテキストシフトとを決定することと、
それぞれのビンに対するビンインデックスと、前記それぞれのコンテキストオフセットと、前記それぞれのコンテキストシフトとを使用して、前記1つ以上のビンの前記それぞれのビンに対する前記それぞれのコンテキストを決定することと、
を行わせる、請求項22記載の非一時的コンピュータ読取可能記憶媒体。
【請求項27】
前記シンタックス要素が、前記最後の有意係数の前記位置のX位置を示す第1のプレフィックスシンタックス要素、または、前記最後の有意係数の前記位置のY位置を示す第2のプレフィックスシンタックス要素のうちの1つであり、前記決定されたそれぞれのコンテキストを使用して、前記最後の有意係数の前記位置を示す前記シンタックス要素に対する前記エントロピーコード化データをデコードするために、前記命令は、前記1つ以上のプロセッサに、さらに、
前記決定されたそれぞれのコンテキストを使用して、前記第1のプレフィックスシンタックス要素または前記第2のプレフィックスシンタックス要素に対する前記エントロピーコード化データをデコードすること、
を行わせる、請求項22記載の非一時的コンピュータ読取可能記憶媒体。
【請求項28】
前記命令は、前記1つ以上のプロセッサに、さらに、
固定長デコーディングを使用して、第1のサフィックスシンタックス要素をデコードすることと、
前記最後の有意係数の前記位置を取得するために、前記第1のプレフィックスシンタックス要素と前記第1のサフィックスシンタックス要素とを逆バイナリ化することと、
を行わせる、請求項27記載の非一時的コンピュータ読取可能記憶媒体。
【請求項29】
変換ブロックのサイズ(TrafoSize)の対数底2を特定する変数(log2TrafoSize)が5より大きいとき、前記導出関数は、前記コンテキストオフセット(ctxOffset)を3*(log2TrafoSize-2)+((log2TrafoSize-1)>>2)+((TrafoSize>>6)<<1)+(TrafoSize>>7)に等しく設定することを備え、ここにおいて、((TrafoSize>>6)<<1)および(TrafoSize>>7)は、前記サイズ依存オフセットに対応し、
前記変数が5以下であるとき、前記導出関数は、前記コンテキストオフセットを3*(log2TrafoSize-2)+((log2TrafoSize-1)>>2)に等しく設定することを備える請求項1に記載の方法。
【請求項30】
変換ブロックのサイズ(TrafoSize)の対数底2を特定する変数(log2TrafoSize)が5より大きいとき、前記導出関数は、前記コンテキストオフセット(ctxOffset)を3*(log2TrafoSize-2)+((log2TrafoSize-1)>>2)+((TrafoSize>>6)<<1)+(TrafoSize>>7)に等しく設定し、ここにおいて、((TrafoSize>>6)<<1)および(TrafoSize>>7)は、前記サイズ依存オフセットに対応し、
前記変数が5以下であるとき、前記導出関数は、前記コンテキストオフセットを3*(log2TrafoSize-2)+((log2TrafoSize-1)>>2)に等しく設定する請求項11に記載の装置。
【発明の詳細な説明】
【関連出願の相互参照】
【0001】
[0001]
本出願は、2019年4月2日に出願された米国仮出願第62/828266号の利益を主張する、2020年3月31日に出願された米国特許出願第16/836033号に対する優先権を主張するものであり、そのそれぞれの内容全体が参照により本明細書に組み込まれている。
【技術分野】
【0002】
[0002]
本開示は、ビデオエンコーディングおよびビデオデコーディングに関連する。
【背景】
【0003】
[0003]
デジタルビデオ能力は、デジタルテレビ、デジタルダイレクトブロードキャストシステム、ワイヤレスブロードキャストシステム、パーソナルデジタルアシスタント(PDA)、ラップトップまたはデスクトップコンピュータ、タブレットコンピュータ、e-ブックリーダ、デジタルカメラ、デジタル記録デバイス、デジタルメディアプレーヤ、ビデオゲームデバイス、ビデオゲームコンソール、セルラまたは衛星無線電話機、いわゆる「スマートフォン」、ビデオ電話会議デバイス、ビデオストリーミングデバイス、および、これらに類するものを含む、幅広い範囲のデバイスに組み込むことができる。デジタルビデオデバイスは、MPEG-2、MPEG-4、ITU-T H.263、ITU-T H.264/MPEG-4、パート10、高度ビデオコーディング(AVC)、ITU-T H.265/高効率ビデオコーディング(HEVC)、および、このような標準規格の拡張によって規定される標準規格に記述されているもののような、ビデオコーディング技法を実現する。ビデオデバイスは、このようなビデオコーディング技法を実現することによって、より効率的にデジタルビデオ情報を送信、受信、エンコード、デコード、および/または、記憶してもよい。
【0004】
[0004]
ビデオコーディング技法は、ビデオシーケンスに内在する冗長を低減または取り除くために、空間的(イントラピクチャー)予測、および/または、時間的(インターピクチャー)予測を含んでいる。ブロックベースのビデオコーディングに対して、ビデオスライス(例えば、ビデオピクチャーまたはビデオピクチャーの一部分)は、コーディングツリーユニット(CTU)、コーディングユニット(CU)および/またはコーディングノードとして呼ばれることもあるかもしれないビデオブロックに区分してもよい。ピクチャーのイントラコード化された(I)スライスにおけるビデオブロックは、同じピクチャーにおける隣接ブロック中の参照サンプルに関する空間的予測を使用してエンコードされる。ピクチャーのインターコード化された(PまたはB)スライスにおけるビデオブロックは、同じピクチャーにおける隣接ブロック中の参照サンプルに関する空間的予測、または、他の参照ピクチャーにおける参照サンプルに関する時間的予測を使用してもよい。ピクチャーは、フレームとして呼ばれることがあり、参照ピクチャーは参照フレームとして呼ばれることがある。
【概要】
【0005】
[0005]
一般的に、本開示は、ビデオコーディングにおけるエントロピーコーディングのための技法を説明している。特に、本開示は、最後の有意係数位置(例えば、最後の位置)を示す1つ以上のシンタックス要素をコンテキスト適応エントロピーエンコードするためのデバイスおよび方法を説明している。最後の有意係数を示すシンタックス要素に対するコンテキストを決定するためのいくつかの例示的な技法は、異なる変換ブロックサイズに渡る異なるビンに対して同じコンテキストを使用させることがある。異なる変換ブロックサイズに渡る異なるビンに対して同じコンテキストを使用することは、コーディング効率の低下、および/または、歪みの望ましくない増加をもたらすかもしれない。
【0006】
[0006]
本開示は、変換ブロックのサイズの関数を使用して、変換ブロック中の最後の有意係数の位置を示すシンタックス要素の1つ以上のビンのそれぞれに対するそれぞれのコンテキストを決定するための技法を説明しており、異なるサイズの変換ブロックに対して同じコンテキストが使用されないように、関数は、それぞれのコンテキストを出力する。むしろ、この関数により、異なるサイズの変換ブロックに対して、最後の有意係数の位置を示すシンタックス要素のそれぞれのビンに対するコンテキストが異なる。このようにして、異なる変換ブロックサイズに渡って、同じコンテキストは使用されず、このようなことから、コーディング効率が改善されるかもしれず、および/または、結果として得られるデコードされたビデオデータはより少ない歪みを示すかもしれない。
【0007】
[0007]
1つの例では、本開示は、ビデオデータをデコードする方法を説明し、方法は、ビデオデータの現在ブロックに対するエントロピーコード化データを受信し、エントロピーコード化データは、現在ブロックの変換ブロック中の最後の有意係数の位置を示すシンタックス要素に対するエントロピーコード化データを含むことと、変換ブロックのサイズの関数を使用して、最後の有意係数の位置を示すシンタックス要素のエントロピーコード化データの1つ以上のビンのそれぞれに対するそれぞれのコンテキストを決定し、異なるサイズの変換ブロックに対して同じコンテキストが使用されないように、関数は、それぞれのコンテキストを出力することと、決定されたそれぞれのコンテキストを使用して、最後の有意係数の位置を示すシンタックス要素に対するエントロピーコード化データをデコードすることとを含んでいる。
【0008】
[0008]
別の例では、本開示は、ビデオデータをデコードするように構成されている装置を説明し、装置は、ビデオデータの現在ブロックを記憶するように構成されているメモリと、メモリと通信する1つ以上のプロセッサとを具備し、1つ以上のプロセッサは、ビデオデータの現在ブロックに対するエントロピーコード化データを受信し、エントロピーコード化データは、現在ブロックの変換ブロック中の最後の有意係数の位置を示すシンタックス要素に対するエントロピーコード化データを含むようにと、変換ブロックのサイズの関数を使用して、最後の有意係数の位置を示すシンタックス要素のエントロピーコード化データの1つ以上のビンのそれぞれに対するそれぞれのコンテキストを決定し、異なるサイズの変換ブロックに対して同じコンテキストが使用されないように、関数は、それぞれのコンテキストを出力するようにと、決定されたそれぞれのコンテキストを使用して、最後の有意係数の位置を示すシンタックス要素に対するエントロピーコード化データをデコードするように構成されている。
【0009】
[0009]
別の例では、本開示は、ビデオデータをデコードするように構成されている装置を説明し、装置は、ビデオデータの現在ブロックに対するエントロピーコード化データを受信し、エントロピーコード化データは、現在ブロックの変換ブロック中の最後の有意係数の位置を示すシンタックス要素に対するエントロピーコード化データを含む手段と、変換ブロックのサイズの関数を使用して、最後の有意係数の位置を示すシンタックス要素のエントロピーコード化データの1つ以上のビンのそれぞれに対するそれぞれのコンテキストを決定し、異なるサイズの変換ブロックに対して同じコンテキストが使用されないように、関数は、それぞれのコンテキストを出力する手段と、決定されたそれぞれのコンテキストを使用して、最後の有意係数の位置を示すシンタックス要素に対するエントロピーコード化データをデコードする手段とを具備している。
【0010】
[0010]
別の例では、本開示は、命令を記憶している非一時的コンピュータ読取可能記憶媒体を説明し、命令は、実行されるときに、ビデオデータをデコードするように構成されているデバイスの1つ以上のプロセッサに、ビデオデータの現在ブロックに対するエントロピーコード化データを受信させ、エントロピーコード化データは、現在ブロックの変換ブロック中の最後の有意係数の位置を示すシンタックス要素に対するエントロピーコード化データを含み、変換ブロックのサイズの関数を使用させて、最後の有意係数の位置を示すシンタックス要素のエントロピーコード化データの1つ以上のビンのそれぞれに対するそれぞれのコンテキストを決定させ、異なるサイズの変換ブロックに対して同じコンテキストが使用されないように、関数は、それぞれのコンテキストを出力し、決定されたそれぞれのコンテキストを使用させて、最後の有意係数の位置を示すシンタックス要素に対するエントロピーコード化データをデコードさせる。
【0011】
[0011]
1つ以上の例の詳細が、添付の図面および以下の説明に記載されている。他の特徴、目的および利点は、説明、図面および特許請求の範囲から明らかになるであろう。
【図面の簡単な説明】
【0012】
図1】[0012] 図1は、本開示の技法を実行してもよい、例示的なビデオエンコーディングおよびデコーディングシステムを図示するブロック図である。
図2】[0013] 図2は、本開示の技法を実行してもよい、例示的なビデオエンコーダを図示するブロック図である。
図3】[0014] 図3は、本開示の技法を実行してもよい、例示的なビデオデコーダを図示するブロック図である。
図4】[0015] 図4は、本開示の例による、例示的なエンコーディング方法を示しているフローチャートである。
図5】[0016] 図5は、本開示の例による、例示的なエントロピーエンコーディング方法を示しているフローチャートである。
図6】[0017] 図6は、本開示の例による、例示的なデコーディング方法を示しているフローチャートである。
図7】[0018] 図7は、本開示の例による、例示的なエントロピーデコーディング方法を示しているフローチャートである。
【詳細な説明】
【0013】
[0019]
一般的に、本開示は、(例えば、コンテキスト適応バイナリ算術コーディングを使用して)シンタックス要素のビンのエントロピーエンコーディングおよびデコーディングにおいて使用されるコンテキスト(例えば、確率モデル)を導出するための技法を説明している。特に、本開示は、変換ブロック中の最後の有意係数のXまたはY位置を示すシンタックス要素のビンに対するコンテキストを決定するための技法を説明している。最後の有意係数を示すシンタックス要素に対するコンテキストを決定するためのいくつかの例示的な技法は、異なる変換ブロックサイズに渡る異なるビンに対して同じコンテキストを使用させるかもしれない。異なる変換ブロックサイズに渡る異なるビンに対して同じコンテキストを使用することは、コーディング効率の低下、および/または、歪みの望ましくない増加をもたらすかもしれない。
【0014】
[0020]
本開示は、変換ブロックのサイズの関数を使用して、変換ブロック中の最後の有意係数の位置を示すシンタックス要素の1つ以上のビンのそれぞれに対するそれぞれのコンテキストを決定するための技法を説明しており、異なるサイズの変換ブロックに対して同じコンテキストが使用されないように、関数は、それぞれのコンテキストを出力する。このようにして、異なる変換ブロックサイズに渡って、同じコンテキストは使用されず、このようなことから、コーディング効率が改善されるかもしれず、および/または、結果として得られるデコードされたビデオデータはより少ない歪みを示すかもしれない。
【0015】
[0021]
図1は、本開示の最後の有意係数位置コーディング技法を実行してもよい、例示的なビデオエンコーディングおよびデコーディングシステム100を図示するブロック図である。本開示の技法は、一般的に、ビデオデータをコード化(エンコードおよび/またはデコード)することに向けられている。一般的に、ビデオデータは、ビデオを処理するための何らかのデータを含んでいる。したがって、ビデオデータは、生のエンコードされていないビデオ、エンコードされたビデオ、デコードされた(例えば、再構築された)ビデオ、および、シグナリングデータのようなビデオメタデータを含んでいてもよい。
【0016】
[0022]
図1に示すように、システム100は、この例では、宛先デバイス116によってデコードされ、表示されるべき、エンコードされたビデオデータを提供する、発信元デバイス102を含んでいる。特に、発信元デバイス102は、コンピュータ読取可能媒体110を介して、ビデオデータを宛先デバイス116に提供する。発信元デバイス102および宛先デバイス116は、デスクトップコンピュータ、ノートブック(すなわち、ラップトップ)コンピュータ、タブレットコンピュータ、セットトップボックス、スマートフォンのような電話ハンドセット、テレビジョン、カメラ、ディスプレイデバイス、デジタルメディアプレーヤ、ビデオゲームコンソール、ビデオストリーミングデバイス、または、これらに類するものを含む、広範囲のデバイスのうちのいずれかを含んでいてもよい。いくつかのケースでは、発信元デバイス102および宛先デバイス116は、ワイヤレス通信のために備えられてもよく、したがって、ワイヤレス通信デバイスとして呼ばれることがある。
【0017】
[0023]
図1の例では、発信元デバイス102は、ビデオソース104と、メモリ106と、ビデオエンコーダ200と、出力インターフェース108とを含んでいる。宛先デバイス116は、入力インターフェース122と、ビデオデコーダ300と、メモリ120と、ディスプレイデバイス118とを含んでいる。本開示によると、発信元デバイス102のビデオエンコーダ200および宛先デバイス116のビデオデコーダ300は、最後の有意係数位置コーディングのための技法を適用するように構成されていてもよい。したがって、発信元デバイス102はビデオエンコーディングデバイスの例を表す一方で、宛先デバイス116はビデオデコーディングデバイスの例を表している。他の例では、発信元デバイスおよび宛先デバイスは、他のコンポーネントまたは構成を含んでいてもよい。例えば、発信元デバイス102は、外部カメラのような外部ビデオソースからビデオデータを受け取ってもよい。同様に、宛先デバイス116は、統合されたディスプレイデバイスを含むよりもむしろ、外部ディスプレイデバイスとインターフェースしていてもよい。
【0018】
[0024]
図1に示されているシステム100は1つの例にすぎない。一般的に、任意のデジタルビデオエンコーディングおよび/またはデコーディングデバイスが、最後の有意係数位置コーディングのための技法を実行してもよい。発信元デバイス102および宛先デバイス116は、発信元デバイス102が宛先デバイス116への送信のためにコード化されたビデオデータを発生させる、このようなコーディングデバイスの例にすぎない。本開示は、データのコーディング(エンコーディングおよび/またはデコーディング)を実行するデバイスとして「コーディング」デバイスに言及する。したがって、ビデオエンコーダ200およびビデオデコーダ300は、コーディングデバイスの例を、特に、それぞれビデオエンコーダおよびビデオデコーダを表している。いくつかの例では、デバイス102、116は、デバイス102、116のそれぞれがビデオエンコーディングコンポーネントとビデオデコーディングコンポーネントとを含むように、実質的に対称的な態様で動作してもよい。したがって、システム100は、例えば、ビデオストリーミング、ビデオ再生、ビデオブロードキャスティング、または、ビデオ電話に対する、ビデオデバイス102とビデオデバイス116との間の一方向または双方向ビデオ送信をサポートしてもよい。
【0019】
[0025]
一般的に、ビデオソース104は、ビデオデータ(すなわち、生のエンコードされていないビデオデータ)のソースを表し、ビデオデータの(「フレーム」としても呼ばれる)シーケンシャルな一連のピクチャーを、ピクチャーに対するデータをエンコードするビデオエンコーダ200に提供する。発信元デバイス102のビデオソース104は、ビデオカメラのようなビデオキャプチャデバイス、以前にキャプチャされた生のビデオを含んでいるビデオアーカイブ、および/または、ビデオコンテンツプロバイダからビデオを受け取るためのビデオフィードインターフェースを含んでいてもよい。さらなる代替として、ビデオソース104は、ソースビデオとしてのコンピュータグラフィックスベースのデータを、または、ライブビデオとアーカイブビデオとコンピュータ発生ビデオとの組み合わせを発生させてもよい。各ケースにおいて、ビデオエンコーダ200は、キャプチャされた、事前キャプチャされた、または、コンピュータが発生させたビデオデータをエンコードする。ビデオエンコーダ200は、(ときには「表示順序」として呼ばれる)受け取った順序から、コーディングのためのコーディング順序にピクチャーを再構成してもよい。ビデオエンコーダ200は、エンコードされたビデオデータを含むビットストリームを発生させてもよい。発信元デバイス102は、その後、例えば、宛先デバイス116の入力インターフェース122による受け取りおよび/または取り出しのために、出力インターフェース108を介して、コンピュータ読取可能媒体110上に、エンコードされたビデオデータを出力してもよい。
【0020】
[0026]
発信元デバイス102のメモリ106および宛先デバイス116のメモリ120は、汎用メモリを表している。いくつかの例では、メモリ106、120は、生のビデオデータ、例えば、ビデオソース104からの生ビデオと、ビデオデコーダ300からの生のデコードされたビデオデータとを記憶してもよい。追加的にまたは代替的に、メモリ106、120は、例えば、ビデオエンコーダ200およびビデオデコーダ300それぞれによって実行可能なソフトウェア命令を記憶していてもよい。この例では、メモリ106およびメモリ120は、ビデオエンコーダ200およびビデオデコーダ300とは別個に示されているが、ビデオエンコーダ200およびビデオデコーダ300はまた、機能的に同様または同等の目的のために内部メモリを含んでいてもよいことを理解すべきである。さらに、メモリ106、120は、例えば、ビデオエンコーダ200から出力され、ビデオデコーダ300に入力される、エンコードされたビデオデータを記憶してもよい。いくつかの例では、メモリ106、120の一部分は、1つ以上のビデオバッファとして割り振られ、例えば、生のデコードされたおよび/またはエンコードされたビデオデータを記憶してもよい。
【0021】
[0027]
コンピュータ読取可能媒体110は、発信元デバイス102から宛先デバイス116へとエンコードされたビデオデータを転送することが可能な任意のタイプの媒体またはデバイスを表していてもよい。1つの例では、コンピュータ読取可能媒体110は、発信元デバイス102が、例えば、無線周波数ネットワークまたはコンピュータベースのネットワークを介して、エンコードされたビデオデータをリアルタイムで宛先デバイス116に直接送信することを可能にする通信媒体を表している。出力インターフェース108は、ワイヤレス通信プロトコルのような通信標準規格にしたがって、エンコードされたビデオデータを含む送信信号を変調してもよく、入力インターフェース122は、受け取った送信信号を復調してもよい。通信媒体は、無線周波数(RF)スペクトルまたは1つ以上の物理送信ラインのような、何らかのワイヤレスまたはワイヤード通信媒体を備えていてもよい。通信媒体は、ローカルエリアネットワーク、ワイドエリアネットワーク、または、インターネットのようなグローバルネットワークのような、パケットベースのネットワークの一部を形成していてもよい。通信媒体は、ルータ、スイッチ、基地局、または、発信元デバイス102から宛先デバイス116への通信を容易にするのに役立つかもしれない他の何らかの機器を含んでいてもよい。
【0022】
[0028]
いくつかの例では、コンピュータ読取可能媒体110は、記憶デバイス112を含んでいてもよい。発信元デバイス102は、出力インターフェース108から記憶デバイス112にエンコードされたデータを出力してもよい。同様に、宛先デバイス116は、入力インターフェース122を介して、記憶デバイス112からのエンコードされたデータにアクセスしてもよい。記憶デバイス112は、ハードドライブ、ブルーレイ(登録商標)ディスク、DVD、CD-ROM、フラッシュメモリ、揮発性または不揮発性メモリ、あるいは、エンコードされたビデオデータを記憶するための他の何らかの適切なデジタル記憶媒体のような、さまざまな分散またはローカルにアクセスされるデータ記憶媒体のいずれかを含んでいてもよい。
【0023】
[0029]
いくつかの例では、コンピュータ読取可能媒体110は、ファイルサーバ114、または、発信元デバイス102により発生されたエンコードされたビデオデータを記憶してもよい別の中間記憶デバイスを含んでいてもよい。発信元デバイス102は、エンコードされたビデオデータを、ファイルサーバ114に、または、発信元デバイス102によって発生されたエンコードされたビデオを記憶してもよい別の中間記憶デバイスに出力してもよい。宛先デバイス116は、ストリーミングまたはダウンロードを介して、ファイルサーバ114からの記憶されているビデオデータにアクセスしてもよい。ファイルサーバ114は、エンコードされたビデオを記憶することと、宛先デバイス116にエンコードされたビデオを送信することとができる、任意のタイプのサーバデバイスであってもよい。ファイルサーバ114は、(例えば、ウェブサイトに対する)ウェブサーバ、ファイル転送プロトコル(FTP)サーバ、コンテンツ配信ネットワークデバイス、または、ネットワーク接続記憶(NAS)デバイスを表していてもよい。宛先デバイス116は、インターネット接続を含む任意の標準的なデータ接続を通して、ファイルサーバ114からのエンコードされたビデオデータにアクセスしてもよい。これは、ファイルサーバ114上に記憶されている、エンコードされたビデオデータにアクセスするのに適している、ワイヤレスチャネル(例えば、Wi-Fi接続)、ワイヤード接続(例えば、デジタル加入者線(DSL)、ケーブルモデム等)、または、その両方の組み合わせを含んでいてもよい。ファイルサーバ114および入力インターフェース122は、ストリーミング送信プロトコル、ダウンロード送信プロトコル、または、これらの組み合わせにしたがって動作するように構成されていてもよい。
【0024】
[0030]
出力インターフェース108および入力インターフェース122は、ワイヤレス送信機/受信機、モデム、ワイヤードネットワーキングコンポーネント(例えば、イーサネット(登録商標)カード)、さまざまなIEEE802.11標準規格のいずれかにしたがって動作するワイヤレス通信コンポーネント、または、他の物理コンポーネントを表していてもよい。出力インターフェース108および入力インターフェース122がワイヤレスコンポーネントを備えている例では、出力インターフェース108および入力インターフェース122は、4G、4G-LTE(登録商標)(ロングタームエボリューション)、LTEアドバンスト、5G、または、これらに類するもののようなセルラ通信標準規格にしたがって、エンコードされたビデオデータのようなデータを転送するように構成されていてもよい。出力インターフェース108がワイヤレス送信機を備えているいくつかの例では、出力インターフェース108および入力インターフェース122は、IEEE802.11仕様、IEEE802.15仕様(例えば、ZigBee(商標))、Bluetooth(登録商標)(商標)標準規格、または、これらに類するもののような他のワイヤレス標準規格にしたがって、エンコードされたビデオデータのようなデータを転送するように構成されていてもよい。いくつかの例では、発信元デバイス102および/または宛先デバイス116は、それぞれのシステムオンチップ(SoC)デバイスを含んでいてもよい。例えば、発信元デバイス102は、ビデオエンコーダ200および/または出力インターフェース108に備わる機能性を実行するSoCデバイスを含んでいてもよく、宛先デバイス116は、ビデオデコーダ300および/または入力インターフェース122に備わる機能性を実行するSoCデバイスを含んでいてもよい。
【0025】
[0031]
本開示の技法は、無線テレビ放送、ケーブルテレビ送信、衛星テレビ送信、HTTPを通した動的適応ストリーミング(DASH)のようなインターネットストリーミングビデオ送信、データ記憶媒体上にエンコードされたデジタルビデオ、データ記憶媒体上に記憶されているデジタルビデオのデコーディング、または、他のアプリケーションのような、さまざまなマルチメディアアプリケーションのうちのいずれかをサポートするビデオコーディングに適用してもよい。
【0026】
[0032]
宛先デバイス116の入力インターフェース122は、コンピュータ読取可能媒体110(例えば、通信媒体、記憶デバイス112、ファイルサーバ114、または、これらに類するもの)からエンコードされたビデオビットストリームを受け取る。コンピュータ読取可能媒体110からのエンコードされたビデオビットストリームは、ビデオブロックまたは他のコード化されたユニット(例えば、スライス、ピクチャー、ピクチャーのグループ、シーケンス、または、これらに類するもの)の特性および/または処理を記述する値を有するシンタックス要素のような、ビデオエンコーダ200によって規定され、ビデオデコーダ300によっても使用されるシグナリング情報を含んでいてもよい。ディスプレイデバイス118は、デコードされたビデオデータのデコードされたピクチャーをユーザに表示する。ディスプレイデバイス118は、ブラウン管(CRT)、液晶ディスプレイ(LCD)、プラズマディスプレイ、有機発光ダイオード(OLED)ディスプレイ、または、別のタイプのディスプレイデバイスのような、さまざまなディスプレイデバイスのうちのいずれかを表していてもよい。
【0027】
[0033]
図1には示されていないが、いくつかの例では、ビデオエンコーダ200およびビデオデコーダ300は、それぞれオーディオエンコーダおよび/またはオーディオデコーダと統合されていてもよく、適切なMUX-DEMUXユニットあるいは他のハードウェアおよび/またはソフトウェアを含んでいて、共通のデータストリームにおけるオーディオおよびビデオの両方を含む多重化されたストリームを取り扱ってもよい。適用可能である場合には、MUX-DEMUXユニットは、ITU.H.223マルチプレクサプロトコル、または、ユーザデータグラムプロトコル(UDP)のような他のプロトコルにしたがっていてもよい。
【0028】
[0034]
ビデオエンコーダ200およびビデオデコーダ300はそれぞれ、1つ以上のマイクロプロセッサ、デジタル信号プロセッサ(DSP)、特定用途向け集積回路(ASIC)、フィールドプログラマブルゲートアレイ(FPGA)、ディスクリート論理、ソフトウェア、ハードウェア、ファームウェア、または、これらの組み合わせのような、さまざまな適したエンコーダおよび/またはデコーダ回路のいずれかとして実現してもよい。技法が部分的にソフトウェアで実現されるとき、デバイスは、適切な、非一時的コンピュータ読取可能媒体においてソフトウェアに対する命令を記憶していてもよく、1つ以上のプロセッサを使用して、ハードウェアにおいて命令を実行して、本開示の技法を実行してもよい。ビデオエンコーダ200およびビデオデコーダ300のそれぞれは、1つ以上のエンコーダまたはデコーダ中に含まれていてもよく、エンコーダまたはデコーダのどちらかは、それぞれのデバイスにおいて、組み合わされたエンコーダ/デコーダ(CODEC)の一部として統合されていてもよい。ビデオエンコーダ200および/またはビデオデコーダ300を含むデバイスは、集積回路、マイクロプロセッサ、および/または、セルラ電話機のようなワイヤレス通信デバイスを備えていてもよい。
【0029】
[0035]
ビデオエンコーダ200およびビデオデコーダ300は、高効率ビデオコーディング(HEVC)としても呼ばれるITU-T H.265のようなビデオコーディング標準規格に、または、マルチビューおよび/またはスケーラブルビデオコーディング拡張のような、ビデオコーディング標準規格に対する拡張にしたがって動作してもよい。代替的に、ビデオエンコーダ200およびビデオデコーダ300は、共同調査テストモデル(JEM)またはバーサタイルビデオコーディング(VVC)としても呼ばれるITU-T H.266のような、他のプロプライエタリまたは業界標準規格にしたがって動作してもよい。VVC標準規格のドラフトは、ブロスらにおける「バーサタイルビデオコーディング(ドラフト4)」、ITU-T SG16WP3およびISO/IEC JTC1/SC29/WG11のジョイントビデオエキスパートチーム(JVET)、第13回ミーティング:マサチューセッツ州マラケシ、2019年1月9日~18日、JVET-M1001-v5(以下「VVCドラフト4」)で説明されている。他の例では、ビデオエンコーダ200およびビデオデコーダ300は、開発中のMPEG-5/EVC(エッセンシャルビデオコーディング)標準規格のうちの1つ以上のバージョンにしたがって動作してもよい。しかしながら、本開示の技術は、何らかの特定のコーディング標準規格には限定されない。
【0030】
[0036]
一般的に、ビデオエンコーダ200およびビデオデコーダ300は、ピクチャーのブロックベースコーディングを実行してもよい。「ブロック」という用語は、一般的に、処理される(例えば、エンコードされる、デコードされる、または、そうでなければ、エンコーディングおよび/またはデコーディングプロセスにおいて使用される)データを含む構造を指している。例えば、ブロックは、ルミナンスデータおよび/またはクロミナンスデータのサンプルの2次元行列を含んでいてもよい。一般的に、ビデオエンコーダ200およびビデオデコーダ300は、YUV(例えば、Y、Cb、Cr)フォーマットで表されるビデオデータをコード化するかもしれない。すなわち、ピクチャーのサンプルに対する赤、緑および青(RGB)データをコード化するよりもむしろ、ビデオエンコーダ200およびビデオデコーダ300は、ルミナンス成分とクロミナンス成分とをコード化するかもしれず、ここで、クロミナンス成分は、赤の色相と青の色相の両方のクロミナンス成分を含んでいてもよい。いくつかの例では、ビデオエンコーダ200は、エンコーディングの前に、受け取ったRGBフォーマットされたデータをYUV表現に変換し、ビデオデコーダ300は、YUV表現をRGBフォーマットに変換する。代替的に、(図示されていない)前処理ユニットおよび後処理ユニットがこれらの変換を実行してもよい。
【0031】
[0037]
本開示は、一般的に、ピクチャーのデータをエンコードまたはデコードするプロセスを含むように、ピクチャーのコーディング(例えば、エンコーディングおよびデコーディング)に言及しているかもしれない。同様に、本開示は、ブロックに対するデータをエンコードまたはデコードするプロセス、例えば、予測および/または残差コーディングを含むように、ピクチャーのブロックのコーディングに言及しているかもしれない。エンコードされたビデオビットストリームは、一般的に、コーディング決定(例えば、コーディングモード)とブロックへのピクチャーの区分とを表す、シンタックス要素に対する一連の値を含んでいる。したがって、ピクチャーまたはブロックをコード化することへの言及は、一般的に、ピクチャーまたはブロックを形成するシンタックス要素に対する値をコード化することとして理解すべきである。
【0032】
[0038]
HEVCは、コーディングユニット(CU)、予測ユニット(PU)および変換ユニット(TU)を含む、さまざまなブロックを規定する。一般的に、コーディングユニットまたは他のタイプのユニットは、ピクチャーの領域のルーマまたはクロマブロックのすべてを指しているかもしれない。例えば、コーディングユニットは、ルーマブロックと、Crクロマブロックと、Cbクロマブロックとを含んでいるかもしれない。他の例では、ルーマブロックおよびクロマブロックは、独立して区分される。この例では、ブロックとユニットは、同義であるかもしれない。HEVCにしたがうと、(ビデオエンコーダ200のような)ビデオコーダは、4分ツリー構造にしたがって、コーディングツリーユニット(CTU)をCUに区分する。すなわち、ビデオコーダは、CTUおよびCUを4つの等しい、オーバーラップしない正方形に区分し、4分ツリーの各ノードは、0または4つの子ノードのいずれかを有する。子ノードのないノードは、「リーフノード」として呼ばれることがあり、このようなリーフノードのCUは、1つ以上のPUおよび/または1つ以上のTUを含んでいてもよい。ビデオコーダは、PUとTUとをさらに区分してもよい。例えば、HEVCでは、残差4分ツリー(RQT)はTUの区分を表している。HEVCでは、PUはインター予測データを表す一方で、TUは残差データを表している。イントラ予測されるCUは、イントラモードインジケーションのようなイントラ予測情報を含んでいる。
【0033】
[0039]
別の例として、ビデオエンコーダ200およびビデオデコーダ300は、EVC、JEMまたはVVCにしたがって動作するように構成されていてもよい。JEMまたはVVCによると、(ビデオエンコーダ200のような)ビデオコーダは、ピクチャーを複数のコーディングツリーユニット(CTU)に区分する。ビデオエンコーダ200は、4分ツリー-2分ツリー(QTBT)構造またはマルチタイプツリー(MTT)構造のようなツリー構造にしたがって、CTUを区分してもよい。QTBT構造は、HEVCのCUとPUとTUとの間の分離のような、複数の区分タイプの概念を除去する。QTBT構造は、4分ツリー区分にしたがって区分される第1のレベルと、2分ツリー区分にしたがって区分される第2のレベルと、の2つのレベルを含んでいる。QTBT構造のルートノードはCTUに対応する。2分ツリーのリーフノードは、コーディングユニット(CU)に対応する。
【0034】
[0040]
MTT区分構造では、4分ツリー(QT)区分と、2分ツリー(BT)区分と、3分ツリー(TT)区分の1つ以上のタイプとを使用して、ブロックを区分してもよい。3分ツリー区分は、ブロックが3つのサブブロックに分割される区分である。いくつかの例では、3分ツリー区分は、中心を通して元のブロックを分けずに、ブロックを3つのサブブロックに分ける。MTTにおける区分タイプ(例えば、QT、BTおよびTT)は、対称または非対称であってもよい。
【0035】
[0041]
いくつかの例では、ビデオエンコーダ200およびビデオデコーダ300は、単一のQTBTまたはMTT構造を使用して、ルミナンス成分とクロミナンス成分のそれぞれを表してもよい一方で、他の例では、ビデオエンコーダ200およびビデオデコーダ300は、ルミナンス成分のために1つのQTBT/MTT構造と、両方のクロミナンス成分のために別のQTBT/MTT構造(または、それぞれのクロミナンス成分のために2つのQTBT/MTT構造)のように、2つ以上のQTBTまたはMTT構造を使用してもよい。
【0036】
[0042]
ビデオエンコーダ200およびビデオデコーダ300は、HEVC毎の4分ツリー区分、QTBT区分、MTT区分、または、他の区分構造を使用するように構成されていてもよい。説明のために、本開示の技法の説明は、QTBT区分に関して提示する。しかしながら、本開示の技法はまた、4分ツリー区分、または、他のタイプの区分も同様に使用するように構成されているビデオコーダに適用してもよいことを理解されたい。
【0037】
[0043]
本開示は、「N×N」および「NバイN」を交換可能に使用して、垂直寸法および水平寸法に関する(CUまたは他のビデオブロックのような)ブロックのサンプル寸法、例えば、16×16サンプルまたは16バイ16サンプルを指すかもしれない。一般的に、16×16のCUは、垂直方向に16個のサンプルを有し(y=16)、水平方向に16個のサンプルを有する(x=16)。同様に、N×NのCUは、一般的に、垂直方向にN個のサンプルを有し、水平方向にN個のサンプルを有し、ここで、Nは非負整数値を表している。CU中のサンプルは、行および列に配置されていてもよい。さらに、CUは、必ずしも垂直方向と同じ数のサンプルを水平方向に有する必要はない。例えば、CUはN×M個のサンプルを備えていてもよく、ここで、Mは必ずしもNに等しいとは限らない。
【0038】
[0044]
ビデオエンコーダ200は、予測および/または残差情報を、ならびに、他の情報を表す、CUに対するビデオデータをエンコードする。予測情報は、CUに対する予測ブロックを形成するために、CUがどのように予測されるべきかを示している。残差情報は、一般的に、エンコーディング前のCUのサンプルと予測ブロックとの間のサンプル毎の差分を表している。
【0039】
[0045]
CUを予測するために、ビデオエンコーダ200は、一般的に、インター予測またはイントラ予測を通して、CUに対する予測ブロックを形成してもよい。インター予測は、一般的に、以前にコード化されたピクチャーのデータからCUを予測することを指す一方で、イントラ予測は、一般的に、同じピクチャーの以前にコード化されたデータからCUを予測することを指している。インター予測を実行するために、ビデオエンコーダ200は、1つ以上の動きベクトルを使用して、予測ブロックを発生させてもよい。ビデオエンコーダ200は、一般的に、動きサーチを実行して、例えば、CUと参照ブロックとの間の差分に関して、CUに密接に一致する参照ブロックを識別してもよい。ビデオエンコーダ200は、絶対差分の和(SAD)、二乗差分の和(SSD)、平均絶対差分(MAD)、平均二乗差分(MSD)、または、他のこのような差分計算を使用して、差分メトリックを計算し、参照ブロックが現在CUに密接に一致するか否かを決定してもよい。いくつかの例では、ビデオエンコーダ200は、単方向予測または双方向予測を使用して、現在CUを予測してもよい。
【0040】
[0046]
EVC、JEMおよびVVCのいくつかの例はまた、インター予測モードと見なしてもよいアフィン動き補償モードを提供する。アフィン動き補償モードでは、ビデオエンコーダ200は、ズームインまたはズームアウト、回転、透視動き、または、他の不規則な動きタイプのような、並進しない動きを表す2つ以上の動きベクトルを決定してもよい。
【0041】
[0047]
イントラ予測を実行するために、ビデオエンコーダ200は、イントラ予測モードを選択して、予測ブロックを発生させてもよい。EVC、JEMおよびVVCのいくつかの例は、さまざまな方向性モードとともに、planarモードおよびDCモードを含む、67個のイントラ予測モードを提供する。一般的に、ビデオエンコーダ200は、現在ブロックのサンプルを予測する、現在ブロック(例えば、CUのブロック)に隣接するサンプルを記述するイントラ予測モードを選択する。ビデオエンコーダ200がラスター走査順序(左から右、上部から下部)でCTUおよびCUをコード化すると仮定すると、このようなサンプルは、一般的に、現在ブロックと同じピクチャー中で、現在ブロックの上、左上または左にあってもよい。
【0042】
[0048]
ビデオエンコーダ200は、現在ブロックに対する予測モードを表すデータをエンコードする。例えば、インター予測モードに対して、ビデオエンコーダ200は、さまざまな利用可能なインター予測モードのうちのどれが使用されるかを表すデータとともに、対応するモードに対する動き情報をエンコードしてもよい。単方向または双方向インター予測に対して、例えば、ビデオエンコーダ200は、高度動きベクトル予測(AMVP)またはマージモードを使用して、動きベクトルをエンコードしてもよい。ビデオエンコーダ200は、類似するモードを使用して、アフィン動き補償モードに対する動きベクトルをエンコードしてもよい。
【0043】
[0049]
ブロックのイントラ予測またはインター予測のような予測に続いて、ビデオエンコーダ200は、ブロックに対する残差データを計算してもよい。残差ブロックのような残差データは、ブロックと、対応する予測モードを使用して形成された、ブロックに対する予測ブロックとの間の、サンプル毎の差分を表している。ビデオエンコーダ200は、1つ以上の変換を残差ブロックに適用して、サンプルドメインの代わりに変換ドメインにおいて、変換されたデータを生成させてもよい。例えば、ビデオエンコーダ200は、離散コサイン変換(DCT)、整数変換、ウェーブレット変換、または、概念的に類似する変換を残差ビデオデータに適用してもよい。さらに、ビデオエンコーダ200は、モード依存分離不可能2次変換(MDNSST)、信号依存変換、カルーネンレーベ変換(KLT)、または、これらに類するもののような、第1の変換に続く2次変換を適用してもよい。ビデオエンコーダ200は、1つ以上の変換の適用に続いて、変換係数を生成させる。
【0044】
[0050]
上述のように、変換係数を生成させるための何らかの変換に続いて、ビデオエンコーダ200は、変換係数の量子化を実行してもよい。量子化は、一般的に、変換係数が量子化されて、係数を表すために使用されるデータの量を場合によっては低減させ、さらなる圧縮を提供するプロセスを指している。量子化プロセスを実行することによって、ビデオエンコーダ200は、係数のいくつか、または、すべてに関係するビット深度を低減させてもよい。例えば、ビデオエンコーダ200は、量子化の間にn-ビット値をm-ビット値に切り捨ててもよく、ここで、nはmよりも大きい。いくつかの例では、量子化を実行するために、ビデオエンコーダ200は、量子化されるべき値のビット単位の右シフトを実行してもよい。
【0045】
[0051]
量子化に続いて、ビデオエンコーダ200は、変換係数を走査し、量子化された変換係数を含む2次元行列から1次元ベクトルを生成させてもよい。走査は、より高いエネルギー(したがって、より低い周波数)の係数をベクトルの前部に配置し、より低いエネルギー(したがって、より高い周波数)の変換係数をベクトルの後部に配置するように設計されていてもよい。いくつかの例では、ビデオエンコーダ200は、予め規定された走査順序を利用して、量子化変換係数を走査し、シリアル化ベクトルを生成させ、その後、ベクトルの量子化変換係数をエントロピーエンコードしてもよい。他の例では、ビデオエンコーダ200は、適応走査を実行してもよい。量子化変換係数を走査して1次元ベクトルを形成した後、ビデオエンコーダ200は、例えば、コンテキスト適応バイナリ算術コーディング(CABAC)にしたがって、1次元ベクトルをエントロピーエンコードしてもよい。ビデオエンコーダ200はまた、ビデオデータをデコードする際に、ビデオデコーダ300によって使用するために、エンコードされたビデオデータに関係するメタデータを記述するシンタックス要素に対する値をエントロピーエンコードしてもよい。
【0046】
[0052]
CABACを実行するために、ビデオエンコーダ200は、コンテキストモデル内のコンテキストを、送信されるべきシンボルに割り当ててもよい。コンテキストは、例えば、シンボルの隣接する値が0値化されているか否かに関連していてもよい。確率決定は、シンボルに割り当てられているコンテキストに基づいていてもよい。
【0047】
[0053]
ビデオエンコーダ200はさらに、例えば、ピクチャーヘッダ中で、ブロックヘッダ中で、スライスヘッダ中で、あるいは、シーケンスパラメータセット(SPS)、ピクチャーパラメータセット(PPS)、または、ビデオパラメータセット(VPS)のような他のシンタックスデータ中で、ビデオデコーダ300への、ブロックベースのシンタックスデータ、ピクチャーベースのシンタックスデータ、および、シーケンスベースのシンタックスデータのようなシンタックスデータを発生させてもよい。ビデオデコーダ300は、同様に、このようなシンタックスデータをデコードして、対応するビデオデータをどのようにデコードするかを決定してもよい。
【0048】
[0054]
このようにして、ビデオエンコーダ200は、エンコードされたビデオデータを含む、例えば、ブロック(例えば、CU)へのピクチャーの区分と、ブロックに対する予測および/または残差情報とを記述する、シンタックス要素を含む、ビットストリームを発生させてもよい。最終的に、ビデオデコーダ300は、ビットストリームを受け取り、エンコードされたビデオデータをデコードしてもよい。
【0049】
[0055]
一般的に、ビデオデコーダ300は、ビデオエンコーダ200によって実行されるプロセスとは逆のプロセスを実行して、ビットストリームのエンコードされたビデオデータをデコードする。例えば、ビデオデコーダ300は、ビデオエンコーダ200のCABACエンコーディングプロセスと、逆ではあるが、実質的に類似する方法で、CABACを使用して、ビットストリームのシンタックス要素に対する値をデコードしてもよい。シンタックス要素は、CTUへのピクチャーの区分情報と、QTBT構造のような、対応する区分構造にしたがって、各CTUを区分することとを規定して、CTUのCUを規定していてもよい。シンタックス要素は、ビデオデータのブロック(例えば、CU)に対する予測および残差情報をさらに規定していてもよい。
【0050】
[0056]
残差情報は、例えば、量子化変換係数によって表されていてもよい。ビデオデコーダ300は、ブロックの量子化された変換係数を逆量子化および逆変換して、ブロックに対する残差ブロックを再生させてもよい。ビデオデコーダ300は、シグナリングされた予測モード(イントラ予測またはインター予測)と、関連する予測情報(例えば、インター予測に対する動き情報)とを使用して、ブロックに対する予測ブロックを形成する。ビデオデコーダ300は、その後、(サンプル毎のベースで)予測ブロックと残差ブロックとを組み合わせて、元のブロックを再生させてもよい。ビデオデコーダ300は、デブロッキングプロセスを実行することのような、追加の処理を実行して、ブロックの境界に沿った視覚的アーティファクトを低減させてもよい。
【0051】
[0057]
本開示の技法によれば、以下でより詳細に説明するように、ビデオエンコーダ200は、ビデオデータの現在ブロックの変換ブロック中の最後の有意係数の位置を示すシンタックス要素を決定し、シンタックス要素を1つ以上のビンにバイナリ化し、変換ブロックのサイズの関数を使用して、最後の有意係数の位置を示すシンタックス要素の1つ以上のビンのそれぞれに対するそれぞれのコンテキストを決定し、異なるサイズの変換ブロックに対して同じコンテキストが使用されないように、関数は、コンテキストを出力し、決定されたコンテキストを使用して、最後の有意係数の位置を示すシンタックス要素の1つ以上のビンをエントロピーエンコードするように構成されていてもよい。
【0052】
[0058]
同様に、ビデオデコーダ300は、ビデオデータの現在ブロックに対するエントロピーコード化データを受信し、エントロピーコード化データは、現在ブロックの変換ブロック中の最後の有意係数の位置を示すシンタックス要素に対するエントロピーコード化データを含み、変換ブロックのサイズの関数を使用して、最後の有意係数の位置を示すシンタックス要素のエントロピーコード化データの1つ以上のビンのそれぞれに対するそれぞれのコンテキストを決定し、異なるサイズの変換ブロックに対して同じコンテキストが使用されないように、関数は、それぞれのコンテキストを出力し、決定されたそれぞれのコンテキストを使用して、最後の有意係数の位置を示すシンタックス要素に対するエントロピーコード化データをデコードするように構成されていてもよい。
【0053】
[0059]
本開示は、一般的に、シンタックス要素のような、ある情報を「シグナリングすること」に関連しているかもしれない。「シグナリング」という用語は、一般的に、シンタックス要素に対する値の通信および/またはエンコードされたビデオデータをデコードするのに使用される他のデータの通信に関連しているかもしれない。すなわち、ビデオエンコーダ200は、ビットストリーム中でシンタックス要素に対する値をシグナリングしてもよい。一般的に、シグナリングは、ビットストリーム中で値を発生させることを指している。上述のように、発信元デバイス102は、実質的にリアルタイムで、または、宛先デバイス116による後の取り出しのために、シンタックス要素を記憶デバイス112中に記憶させるときに起こるかもしれないような、リアルタイムではなく、ビットストリームを宛先デバイス116に転送してもよい。
【0054】
[0060]
図2は、本開示の最後の有意係数コーディング技法を実行してもよい、例示的なビデオエンコーダ200を図示するブロック図である。図2は、説明の目的のために提供されており、本開示において広く例示し説明しているような技法の限定と見なすべきではない。説明の目的のために、本開示は、HEVCビデオコーディング標準規格ならびに開発中のEVCおよびVVCビデオコーディング標準規格のような、ビデオコーディング標準規格の状況で、ビデオエンコーダ200を説明している。しかしながら、本開示の技法は、これらのビデオコーディング標準規格には限定されず、一般的に、ビデオエンコーディングおよびデコーディングに適用可能である。
【0055】
[0061]
図2の例では、ビデオエンコーダ200は、ビデオデータメモリ230と、モード選択ユニット202と、残差発生ユニット204と、変換処理ユニット206と、量子化ユニット208と、逆量子化ユニット210と、逆変換処理ユニット212と、再構築ユニット214と、フィルタユニット216と、デコードピクチャーバッファ(DBP)218と、エントロピーエンコーディングユニット220とを含んでいる。ビデオデータメモリ230と、モード選択ユニット202と、残差発生ユニット204と、変換処理ユニット206と、量子化ユニット208と、逆量子化ユニット210と、逆変換処理ユニット212と、再構築ユニット214と、フィルタユニット216と、DBP218と、エントロピーエンコーディングユニット220のいずれかまたはすべてを、1つ以上のプロセッサ中で、または、処理回路中で実現してもよい。さらに、ビデオエンコーダ200は、これらまたは他の機能を実行するために、追加または代替のプロセッサまたは処理回路を含んでいてもよい。
【0056】
[0062]
ビデオデータメモリ230は、ビデオエンコーダ200のコンポーネントによってエンコードされるべきビデオデータを記憶していてもよい。ビデオエンコーダ200は、例えば、ビデオソース104(図1)からのビデオデータメモリ230中に記憶されているビデオデータを受け取ってもよい。DPB218は、ビデオエンコーダ200による後続のビデオデータの予測において使用するための参照ビデオデータを記憶する参照ピクチャーメモリとして機能してもよい。ビデオデータメモリ230およびDPB218は、同期ダイナミックランダムアクセスメモリ(DRAM)(SDRAM)を含むDRAM、磁気抵抗RAM(MRAM)、抵抗RAM(RRAM(登録商標))、または、他のタイプのメモリデバイスのような、さまざまなメモリデバイスのうちのいずれかによって形成されていてもよい。ビデオデータメモリ230およびDPB218は、同じメモリデバイスまたは別個のメモリデバイスによって提供されていてもよい。さまざまな例では、ビデオデータメモリ230は、図示するように、ビデオエンコーダ200の他のコンポーネントとともにオンチップであってもよく、または、これらのコンポーネントに対してオフチップであってもよい。
【0057】
[0063]
本開示では、ビデオデータメモリ230への参照は、そのように具体的に説明されない限り、ビデオエンコーダ200に対して内部であるメモリに、または、そのように具体的に説明されない限り、ビデオエンコーダ200に対して外部であるメモリに限定されるものとして解釈すべきではない。むしろ、ビデオデータメモリ230への参照は、ビデオエンコーダ200がエンコードするために受け取るビデオデータ(例えば、エンコードされるべき現在ブロックに対するビデオデータ)を記憶する参照メモリとして理解すべきである。図1のメモリ106はまた、ビデオエンコーダ200のさまざまなユニットからの出力の一時記憶装置を提供してもよい。
【0058】
[0064]
図2のさまざまなユニットは、ビデオエンコーダ200によって実行される動作の理解を助けるために図示されている。ユニットは、固定機能回路、プログラマブル回路、または、これらの組み合わせとして実現してもよい。固定機能回路は、特定の機能性を提供する回路を指し、実行できる動作に対して予め設定される。プログラマブル回路は、さまざまなタスクを実行するようにプログラムでき、実行できる動作において柔軟な機能性を提供できる回路を指している。例えば、プログラマブル回路は、ソフトウェアまたはファームウェアの命令によって規定される方法でプログラマブル回路を動作させるソフトウェアまたはファームウェアを実行してもよい。固定機能回路は、(例えば、パラメータを受け取るまたはパラメータを出力するために)ソフトウェア命令を実行するかもしれないが、固定機能回路が実行する動作のタイプは一般的に不変である。いくつかの例では、ユニットのうちの1つ以上は、別個の回路ブロック(固定機能またはプログラマブル)であってよく、いくつかの例では、1つ以上のユニットは集積回路であってよい。
【0059】
[0065]
ビデオエンコーダ200は、算術論理ユニット(ALU)、基本機能ユニット(EFU)、デジタル回路、アナログ回路、および/または、プログラマブル回路から形成されているプログラマブルコアを含んでいてもよい。ビデオエンコーダ200の動作が、プログラマブル回路によって実行されるソフトウェアを使用して実施される例では、メモリ106(図1)は、ビデオエンコーダ200が受け取って実行するソフトウェアのオブジェクトコードを記憶していてもよく、または、ビデオエンコーダ200内の(図示されていない)別のメモリがこのような命令を記憶していてもよい。
【0060】
[0066]
ビデオデータメモリ230は、受け取ったビデオデータを記憶するように構成されている。ビデオエンコーダ200は、ビデオデータメモリ230からビデオデータのピクチャーを取り出し、ビデオデータを残差発生ユニット204およびモード選択ユニット202に提供してもよい。ビデオデータメモリ230中のビデオデータは、エンコードされるべき生のビデオデータであってもよい。
【0061】
[0067]
モード選択ユニット202は、動き推定ユニット222と、動き補償ユニット224と、イントラ予測ユニット226とを含んでいる。モード選択ユニット202は、他の予測モードにしたがってビデオ予測を実行するための追加の機能ユニットを含んでいてもよい。例として、モード選択ユニット202は、パレットユニット、(動き推定ユニット222および/または動き補償ユニット224の一部であってもよい)イントラブロックコピーユニット、アフィンユニット、線形モデル(LM)ユニット、または、これらに類するものを含んでいてもよい。
【0062】
[0068]
モード選択ユニット202は、一般的に、複数のエンコーディングパスを調整して、エンコーディングパラメータの組み合わせをテストし、結果として、このような組み合わせに対するレート歪み値を得る。エンコーディングパラメータは、CTUのCUへの区分、CUに対する予測モード、CUの残差データに対する変換タイプ、CUの残差データに対する量子化パラメータ等を含んでいてもよい。モード選択ユニット202は、最終的に、他のテストされた組み合わせよりも良好なレート歪み値を有するエンコーディングパラメータの組み合わせを選択してもよい。
【0063】
[0069]
ビデオエンコーダ200は、ビデオデータメモリ230から取り出されたピクチャーを一連のCTUに区分し、スライス内に1つ以上のCTUをカプセル化してもよい。モード選択ユニット202は、上記で説明したQTBT構造またはHEVCの4分ツリー構造のようなツリー構造にしたがって、ピクチャーのCTUを区分してもよい。上記で説明したように、ビデオエンコーダ200は、ツリー構造にしたがってCTUを区分することから1つ以上のCUを形成してもよい。このようなCUは、一般的に、「ビデオブロック」または「ブロック」として呼ばれることもある。
【0064】
[0070]
一般的に、モード選択ユニット202はまた、そのコンポーネント(例えば、動き推定ユニット222、動き補償ユニット224、および、イントラ予測ユニット226)を制御して、現在ブロック(例えば、現在CU、または、HEVCでは、PUとTUとのオーバーラップする部分)に対する予測ブロックを発生させる。現在ブロックのインター予測のために、動き推定ユニット222は、動きサーチを実行して、1つ以上の参照ピクチャー(例えば、DPB218中に記憶されている1つ以上の以前にコード化されたピクチャー)中の1つ以上の密接に一致する参照ブロックを識別してもよい。特に、動き推定ユニット222は、例えば、絶対差分の和(SAD)、二乗差分の和(SSD)、平均絶対差分(MAD)、平均二乗差分(MSD)、または、これらに類するものにしたがって、潜在的参照ブロックが現在ブロックにどれだけ類似しているかを表す値を計算してもよい。動き推定ユニット222は、一般的に、現在ブロックと考慮されている参照ブロックとの間のサンプル毎の差分を使用して、これらの計算を実行してもよい。動き推定ユニット222は、現在ブロックに最も密接に一致する参照ブロックを示す、これらの計算から結果的に生じる最低値を有する参照ブロックを識別してもよい。
【0065】
[0071]
動き推定ユニット222は、現在ピクチャー中の現在ブロックの位置に対する、参照ピクチャー中の参照ブロックの位置を規定する、1つ以上の動きベクトル(MV)を形成してもよい。動き推定ユニット222は、その後、動きベクトルを動き補償ユニット224に提供してもよい。例えば、単方向インター予測に対して、動き推定ユニット222は単一の動きベクトルを提供するかもしれない一方で、双方向インター予測に対して、動き推定ユニット222は2つの動きベクトルを提供するかもしれない。動き補償ユニット224は、その後、動きベクトルを使用して、予測ブロックを発生させてもよい。例えば、動き補償ユニット224は、動きベクトルを使用して、参照ブロックのデータを取り出してもよい。別の例として、動きベクトルが小数サンプル精度を有する場合には、動き補償ユニット224は、1つ以上の補間フィルタにしたがって、予測ブロックに対する値を補間してもよい。さらに、双方向インター予測に対して、動き補償ユニット224は、それぞれの動きベクトルによって識別された2つの参照ブロックに対するデータを取り出し、例えば、サンプル毎の平均化または重み付き平均化を通して、取り出されたデータを組み合わせてもよい。
【0066】
[0072]
別の例として、イントラ予測またはイントラ予測コーディングに対して、イントラ予測ユニット226は、現在ブロックに隣接するサンプルから予測ブロックを発生させてもよい。例えば、方向モードに対して、イントラ予測ユニット226は、一般的に、隣接サンプルの値を数学的に組み合わせ、現在ブロックに渡って規定された方向でこれらの計算された値を格納して、予測ブロックを生成させてもよい。別の例として、DCモードに対して、イントラ予測ユニット226は、現在ブロックに対する隣接サンプルの平均を計算し、予測ブロックの各サンプルに対するこの結果として得られる平均を含むように予測ブロックを発生させてもよい。
【0067】
[0073]
モード選択ユニット202は、予測ブロックを残差発生ユニット204に提供する。残差発生ユニット204は、ビデオデータメモリ230から現在ブロックの生のエンコードされていないバージョンを受け取り、モード選択ユニット202から予測ブロックを受け取る。残差発生ユニット204は、現在ブロックと予測ブロックとの間のサンプル毎の差分を計算する。結果として得られるサンプル毎の差分は、現在ブロックに対する残差ブロックを規定する。いくつかの例では、残差発生ユニット204はまた、残差ブロック中のサンプル値間の差分を決定して、残差差分パルスコード変調(RDPCM)を使用して、残差ブロックを発生させてもよい。いくつかの例では、残差発生ユニット204は、バイナリ減算を実行する1つ以上の減算器回路を使用して形成されていてもよい。
【0068】
[0074]
モード選択ユニット202がCUをPUに区分する例では、各PUは、ルーマ予測ユニットおよび対応するクロマ予測ユニットに関係していてもよい。ビデオエンコーダ200およびビデオデコーダ300は、さまざまなサイズを有するPUをサポートしていてもよい。上記で示したように、CUのサイズは、CUのルーマコーディングブロックのサイズを指していてもよく、PUのサイズは、PUのルーマ予測ユニットのサイズを指していてもよい。特定のCUのサイズが2N×2Nであると仮定すると、ビデオエンコーダ200は、イントラ予測に対する2N×2NまたはN×NのPUサイズと、インター予測に対する2N×2N、2N×N、N×2N、N×N、または、これらに類する対称PUサイズとをサポートしていてもよい。ビデオエンコーダ200およびビデオデコーダ300はまた、インター予測のための、2N×nU、2N×nD、nL×2N、および、nR×2NのPUサイズに対する非対称区分をサポートしていてもよい。
【0069】
[0075]
モード選択ユニット202がCUをPUにさらに区分しない例では、各CUは、ルーマコーディングブロックおよび対応するクロマコーディングブロックに関係していてもよい。上記のように、CUのサイズは、CUのルーマコーディングブロックのサイズを指していてもよい。ビデオエンコーダ200およびビデオデコーダ300は、2N×2N、2N×N、または、N×2NのCUサイズをサポートしていてもよい。
【0070】
[0076]
イントラブロックコピーモードコーディング、アフィンモードコーディング、および、線形モデル(LM)モードコーディングのような、他のビデオコーディング技法に対して、いくつかの例として、モード選択ユニット202は、コーディング技法に関係するそれぞれのユニットを介して、エンコードされている現在ブロックに対する予測ブロックを発生させる。パレットモードコーディングのようないくつかの例では、モード選択ユニット202は、予測ブロックを発生させず、代わりに、選択されたパレットに基づいて、ブロックを再構築する方法を示すシンタックス要素を発生させてもよい。このようなモードでは、モード選択ユニット202は、これらのシンタックス要素を、エンコードされるようにエントロピーエンコーディングユニット220に提供してもよい。
【0071】
[0077]
上記で説明したように、残差発生ユニット204は、現在ブロックおよび対応する予測ブロックに対するビデオデータを受け取る。残差発生ユニット204は、その後、現在ブロックに対する残差ブロックを発生させる。残差ブロックを発生させるために、残差発生ユニット204は、予測ブロックと現在ブロックとの間のサンプル毎の差分を計算する。
【0072】
[0078]
変換処理ユニット206は、残差ブロックに1つ以上の変換を適用して、(ここでは「変換係数ブロック」として呼ばれる)変換係数のブロックを発生させる。変換処理ユニット206は、残差ブロックにさまざまな変換を適用して、変換係数ブロックを形成してもよい。例えば、変換処理ユニット206は、離散コサイン変換(DCT)、方向変換、カルーネンレーベ変換(KLT)、または、概念的に類似する変換を、残差ブロックに適用してもよい。いくつかの例では、変換処理ユニット206は、残差ブロックに対して複数の変換、例えば、回転変換のような、1次変換と2次変換とを実行してもよい。いくつかの例では、変換処理ユニット206は、残差ブロックに変換を適用しない。
【0073】
[0079]
量子化ユニット208は、変換係数ブロック中の変換係数を量子化して、量子化された変換係数ブロックを生成させてもよい。量子化ユニット208は、現在ブロックに関係する量子化パラメータ(QP)値にしたがって、変換係数ブロックの変換係数を量子化してもよい。ビデオエンコーダ200は(例えば、モード選択ユニット202を介して)、CUに関係するQP値を調節することによって、現在ブロックに関係する変換係数ブロックに適用される量子化の程度を調節してもよい。量子化は、情報の損失をもたらすかもしれず、したがって、量子化された変換係数は、変換処理ユニット206によって生成された元の変換係数よりも低い精度を有するかもしれない。
【0074】
[0080]
逆量子化ユニット210および逆変換処理ユニット212は、逆量子化および逆変換をそれぞれ量子化された変換係数ブロックに適用して、変換係数ブロックから残差ブロックを再構築してもよい。再構築ユニット214は、再構築された残差ブロックと、モード選択ユニット202によって発生させた予測ブロックとに基づいて、(潜在的にある程度の歪みを有するが)現在ブロックに対応する再構築されたブロックを生成させてもよい。例えば、再構築ユニット214は、再構築された残差ブロックのサンプルを、モード選択ユニット202によって発生させた予測ブロックからの対応するサンプルに加算して、再構築されたブロックを生成させてもよい。
【0075】
[0081]
フィルタユニット216は、再構築されたブロック上で1つ以上のフィルタ動作を実行してもよい。例えば、フィルタユニット216は、デブロッキング動作を実行して、CUのエッジに沿ったブロッキネスアーティファクトを低減させてもよい。いくつかの例では、フィルタユニット216の動作はスキップしてもよい。
【0076】
[0082]
ビデオエンコーダ200は、再構築されたブロックをDPB218中に記憶させる。例えば、フィルタユニット216の動作が必要ない例では、再構築ユニット214は、再構築されたブロックをDPB218中に記憶させてもよい。フィルタユニット216の動作が必要な例では、フィルタユニット216は、再構築されフィルタされたブロックをDPB218中に記憶させてもよい。動き推定ユニット222および動き補償ユニット224は、再構築された(そして、潜在的にフィルタ処理された)ブロックから形成された参照ピクチャーをDPB218から取り出して、後にエンコードされるピクチャーのブロックをインター予測してもよい。加えて、イントラ予測ユニット226は、現在ピクチャーのDPB218中の再構築されたブロックを使用して、現在ピクチャー中の他のブロックをイントラ予測してもよい。
【0077】
[0083]
一般的に、エントロピーエンコーディングユニット220は、ビデオエンコーダ200の他の機能的なコンポーネントから受け取ったシンタックス要素をエントロピーエンコードしてもよい。例えば、エントロピーエンコーディングユニット220は、量子化ユニット208からの量子化された変換係数ブロックをエントロピーエンコードしてもよい。別の例として、エントロピーエンコーディングユニット220は、モード選択ユニット202からの予測シンタックス要素(例えば、インター予測に対する動き情報またはイントラ予測に対するイントラモード情報)をエントロピーエンコードしてもよい。エントロピーエンコーディングユニット220は、ビデオデータの別の例であるシンタックス要素に関して、1つ以上のエントロピーエンコーディング動作を実行して、エントロピーエンコードされたデータを発生させてもよい。例えば、エントロピーエンコーディングユニット220は、データに、コンテキスト適応可変長コーディング(CAVLC)動作、CABAC動作、可変対可変(V2V)長コーディング動作、シンタックスベースのコンテキスト適応バイナリ算術コードディング(SBAC)動作、確率区間区分化エントロピー(PIPE)コーディング動作、指数ゴロムエンコーディング動作、または、別のタイプのエントロピーエンコーディング動作を実行してもよい。いくつかの例では、エントロピーエンコーディングユニット220は、シンタックス要素がエントロピーエンコードされないバイパスモードで動作してもよい。
【0078】
[0084]
以下でより詳細に説明する本開示の技法によれば、エントロピーエンコーディングユニット220は、変換ブロック中の最後の有意係数のXまたはY位置を示すシンタックス要素の1つ以上のビンをエンコードするようにさらに構成されていてもよい。最後の有意係数位置は、最後の非0変換係数の、係数走査順序に沿った位置である。ビデオデコーダ300は、最後の有意係数の位置を使用して、変換ブロック中の変換係数の逆走査順序をどこで開始するかを決定してもよい。
【0079】
[0085]
エントロピーエンコーディングユニット220は、ビデオデータの現在ブロックの変換ブロック中の最後の有意係数の位置を示すシンタックス要素を決定し、シンタックス要素を1つ以上のビンにバイナリ化し、変換ブロックのサイズの関数を使用して、最後の有意係数の位置を示すシンタックス要素の1つ以上のビンのそれぞれに対するそれぞれのコンテキストを決定し、異なるサイズの変換ブロックに対して同じコンテキストが使用されないように、関数は、コンテキストを出力し、決定されたコンテキストを使用して、最後の有意係数の位置を示すシンタックス要素の1つ以上のビンをエントロピーエンコードするように構成されていてもよい。上記で説明したように、異なるサイズの変換ブロックに対して同じコンテキストが使用されないように、コンテキストを出力する関数を使用することにより、異なるブロックサイズに渡って同じコンテキストが再使用される技法と比較して、コーディング効率が改善されるかもしれず、および/または、結果として得られるデコードされたビデオデータがより少ない歪みを示すかもしれない。
【0080】
[0086]
本開示の1つの例では、エントロピーエンコーディングユニット220は、64×64変換ブロックをエンコードするように構成されていてもよい。この例では、エントロピーエンコーディングユニット220は、64×64変換ブロックに対する第1の関数を使用して、64×64変換ブロック中の最後の有意係数の位置を示すシンタックス要素の1つ以上のビンのそれぞれに対するそれぞれのコンテキストを決定するように構成されていてもよく、第1の関数は、32×32変換ブロックに対する最後の有意係数の位置を示すシンタックス要素の1つ以上のビンのそれぞれに対するそれぞれのコンテキストを決定するのに使用される第2の関数とは異なる。
【0081】
[0087]
ビデオエンコーダ200は、スライスまたはピクチャーのブロックを再構築するのに必要とされるエントロピーエンコードされたシンタックス要素を含むビットストリームを出力してもよい。特に、エントロピーエンコーディングユニット220が、ビットストリームを出力してもよい。
【0082】
[0088]
上記で説明している動作は、ブロックに関して説明している。このような説明は、ルーマコーディングブロックおよび/またはクロマコーディングブロックに対する動作として理解すべきである。上述したように、いくつかの例では、ルーマコーディングブロックおよびクロマコーディングブロックは、CUのルーマ成分およびクロマ成分である。いくつかの例では、ルーマコーディングブロックおよびクロマコーディングブロックは、PUのルーマ成分およびクロマ成分である。
【0083】
[0089]
いくつかの例では、ルーマコーディングブロックに関して実行される動作は、クロマコーディングブロックに対して繰り返す必要はない。1つの例として、ルーマコーディングブロックに対する動きベクトル(MV)および参照ピクチャーを識別する動作は、クロマブロックに対するMVおよび参照ピクチャーを識別するために繰り返す必要はない。むしろ、ルーマコーディングブロックに対するMVをスケーリングして、クロマブロックに対するMVを決定してもよく、参照ピクチャーは同じであってもよい。別の例として、イントラ予測プロセスは、ルーマコーディングブロックおよびクロマコーディングブロックに対して同じであってもよい。
【0084】
[0090]
図3は、本開示の最後の有意係数デコーディング技法を実行してもよい、例示的なビデオデコーダ300を図示するブロック図である。図3は、説明の目的のために提供されており、本開示で広く例示し説明しているような技法には限定されない。説明の目的で、本開示は、EVC、VVCおよびHEVCの技法にしたがうビデオデコーダ300を説明している。しかしながら、本開示の技法は、他のビデオコーディング標準規格に構成されているビデオコーディングデバイスによって実行してもよい。
【0085】
[0091]
図3の例では、ビデオデコーダ300は、コード化ピクチャーバッファ(CPB)メモリ320と、エントロピーデコーディングユニット302と、予測処理ユニット304と、逆量子化ユニット306と、逆変換処理ユニット308と、再構築ユニット310と、フィルタユニット312と、デコードピクチャーバッファ(DPB)314とを含んでいる。CPBメモリ320と、エントロピーデコーディングユニット302と、予測処理ユニット304と、逆量子化ユニット306と、逆変換処理ユニット308と、再構築ユニット310と、フィルタユニット312と、DPB314のいずれかまたはすべてを、1つ以上のプロセッサ中で、または、処理回路中で実現してもよい。さらに、ビデオデコーダ300は、これらまたは他の機能を実行するために、追加または代替のプロセッサまたは処理回路を含んでいてもよい。
【0086】
[0092]
予測処理ユニット304は、動き補償ユニット316とイントラ予測ユニット318とを含んでいる。予測処理ユニット304は、他の予測モードにしたがって予測を実行するための追加ユニットを含んでいてもよい。例として、予測処理ユニット304は、パレットユニット、(動き補償ユニット316の一部を形成していてもよい)イントラブロックコピーユニット、アフィンユニット、線形モデル(LM)ユニット、または、これらに類するものを含んでいてもよい。他の例では、ビデオデコーダ300は、より多い、より少ない、または、異なる機能的コンポーネントを含んでいてもよい。
【0087】
[0093]
CPBメモリ320は、ビデオデコーダ300のコンポーネントによってデコードされるべき、エンコードされたビデオビットストリームのようなビデオデータを記憶してもよい。CPBメモリ320中に記憶されるビデオデータは、例えば、コンピュータ読取可能媒体110(図1)から取得されてもよい。CPBメモリ320は、エンコードされたビデオビットストリームからのエンコードされたビデオデータ(例えば、シンタックス要素)を記憶するCPBを含んでいてもよい。また、CPBメモリ320は、ビデオデコーダ300のさまざまなユニットからの出力を表す一時データのような、コード化されたピクチャーのシンタックス要素以外のビデオデータを記憶してもよい。DPB314は、一般的に、デコードされたピクチャーを記憶し、エンコードされたビデオビットストリームの後続のデータまたはピクチャーをデコードするときに、ビデオデコーダ300が、このデコードされたピクチャーを、参照ビデオデータとして出力および/または使用してもよい。CPBメモリ320およびDPB314は、同期ダイナミックランダムアクセスメモリ(DRAM)(SDRAM)を含むDRAM、磁気抵抗RAM(MRAM)、抵抗RAM(RRAM(登録商標))、または、他のタイプのメモリデバイスのような、さまざまなメモリデバイスのいずれかによって形成されていてもよい。CPBメモリ320およびDPB314は、同じメモリデバイスまたは別個のメモリデバイスによって提供されてもよい。さまざまな例では、CPBメモリ320は、ビデオデコーダ300の他のコンポーネントとともにオンチップであるか、または、これらのコンポーネントに対してオフチップであってもよい。
【0088】
[0094]
追加的にまたは代替的に、いくつかの例では、ビデオデコーダ300は、メモリ120(図1)からコード化されたビデオデータを取り出してもよい。すなわち、メモリ120は、CPBメモリ320を用いて上記で説明したようなデータを記憶していてもよい。同様に、ビデオデコーダ300の機能性のいくつかまたはすべてが、ビデオデコーダ300の処理回路によって実行されるソフトウェアで実現されるとき、メモリ120は、ビデオデコーダ300によって実行されるべき命令を記憶していてもよい。
【0089】
[0095]
図3中に示されているさまざまなユニットは、ビデオデコーダ300によって実行される動作の理解を助けるために図示されている。ユニットは、固定機能回路、プログラマブル回路、または、これらの組み合わせとして実現してもよい。図2と同様に、固定機能回路は、特定の機能性を提供する回路を指し、実行できる動作に対して予め設定される。プログラマブル回路は、さまざまなタスクを実行するようにプログラムでき、実行できる動作において柔軟な機能性を提供できる回路を指している。例えば、プログラマブル回路は、ソフトウェアまたはファームウェアの命令によって規定される方法でプログラマブル回路を動作させるソフトウェアまたはファームウェアを実行してもよい。固定機能回路は、(例えば、パラメータを受け取るまたはパラメータを出力するために)ソフトウェア命令を実行するかもしれないが、固定機能回路が実行する動作のタイプは一般的に不変である。いくつかの例では、ユニットのうちの1つ以上は、別個の回路ブロック(固定機能またはプログラマブル)であってもよく、いくつかの例では、1つ以上のユニットは集積回路であってもよい。
【0090】
[0096]
ビデオデコーダ300は、ALU、EFU、デジタル回路、アナログ回路、および/または、プログラマブル回路から形成されているプログラマブルコアを含んでいてもよい。ビデオデコーダ300の動作がプログラマブル回路上で実行するソフトウェアによって実行される例では、オンチップまたはオフチップメモリが、ビデオデコーダ300が受け取って実行するソフトウェアの命令(例えば、オブジェクトコード)を記憶していてもよい。
【0091】
[0097]
エントロピーデコーディングユニット302は、CPBからエンコードされたビデオデータを受け取り、ビデオデータをエントロピーデコードして、シンタックス要素を再生させてもよい。予測処理ユニット304、逆量子化ユニット306、逆変換処理ユニット308、再構築ユニット310、および、フィルタユニット312は、ビットストリームから抽出されたシンタックス要素に基づいて、デコードされたビデオデータを発生させてもよい。
【0092】
[0098]
一般的に、ビデオデコーダ300は、ブロック毎のベースでピクチャーを再構築する。ビデオデコーダ300は、各ブロックに対して個別に再構築動作を実行してもよい(現在再構築されている、すなわち、デコードされているブロックは、「現在ブロック」として呼ばれることがある)。
【0093】
[0099]
エントロピーデコーディングユニット302は、量子化された変換係数ブロックの量子化された変換係数を規定するシンタックス要素とともに、量子化パラメータ(QP)および/または変換モードインジケーションのような変換情報をエントロピーデコードしてもよい。逆量子化ユニット306は、量子化変換係数ブロックに関係するQPを使用して、量子化の程度を、そして、同様に、逆量子化ユニット306が適用する逆量子化の程度を決定してもよい。逆量子化ユニット306は、例えば、ビット単位の左シフト演算を実行して、変換係数を逆量子化してもよい。それによって、逆量子化ユニット306は、変換係数を含む変換係数ブロックを形成してもよい。
【0094】
[0100]
以下でより詳細に説明する本開示の技法によれば、エントロピーデコーディングユニット302は、変換ブロック中の最後の有意係数のXまたはY位置を示すシンタックス要素の1つ以上のビンをデコードするようにさらに構成されていてもよい。最後の有意係数位置は、最後の非0変換係数の、走査順序に沿った位置である。エントロピーデコーディングユニット302は、最後の有意係数の位置を使用して、変換ブロック中の変換係数の逆走査順序をどこで開始するかを決定してもよい。
【0095】
[0101]
エントロピーデコーディングユニット302は、ビデオデータの現在ブロックに対するエントロピーコード化データを受信し、エントロピーコード化データは、現在ブロックの変換ブロック中の最後の有意係数の位置を示すシンタックス要素に対するエントロピーコード化データを含むように構成されていてもよい。エントロピーデコーディングユニット302は、変換ブロックのサイズの関数を使用して、最後の有意係数の位置を示すシンタックス要素のエントロピーコード化データの1つ以上のビンのそれぞれに対するそれぞれのコンテキストを決定し、異なるサイズの変換ブロックに対して同じコンテキストが使用されないように、関数は、それぞれのコンテキストを出力し、決定されたそれぞれのコンテキストを使用して、最後の有意係数の位置を示すシンタックス要素に対するエントロピーコード化データをデコードしてもよい。上記で説明したように、異なるサイズの変換ブロックに対して同じコンテキストが使用されないように、コンテキストを出力する1つ以上の関数を使用することにより、同じコンテキストが異なるブロックサイズに渡って再使用される技法と比較して、コーディング効率が改善されるかもしれず、および/または、結果として得られるデコードされたビデオデータはより少ない歪みを示すかもしれない。
【0096】
[0102]
本開示の1つの例では、エントロピーデコーディングユニット302は、64×64変換ブロックをデコードするように構成されていてもよい。この例では、エントロピーデコーディングユニット302は、64×64変換ブロックに対する第1の関数を使用して、64×64変換ブロック中の最後の有意係数の位置を示すシンタックス要素のエントロピーコード化データの1つ以上のビンのそれぞれに対するそれぞれのコンテキストを決定するように構成されていてもよく、第1の関数は、32×32変換ブロックに対する最後の有意係数の位置を示すシンタックス要素のエントロピーコード化データの1つ以上のビンのそれぞれに対するそれぞれのコンテキストを決定するのに使用される第2の関数とは異なる。
【0097】
[0103]
逆量子化ユニット306が、変換係数ブロックを形成した後、逆変換処理ユニット308は、変換係数ブロックに1つ以上の逆変換を適用して、現在ブロックに関係する残差ブロックを発生させてもよい。例えば、逆変換処理ユニット308は、変換係数ブロックに、逆DCT、逆整数変換、逆カルーネンレーベ変換(KLT)、逆回転変換、逆方向変換、または、別の逆変換を適用してもよい。
【0098】
[0104]
さらに、予測処理ユニット304は、エントロピーデコーディングユニット302によってエントロピーデコードされた予測情報シンタックス要素にしたがって、予測ブロックを発生させる。例えば、現在ブロックがインター予測されることを予測情報シンタックス要素が示す場合には、動き補償ユニット316が予測ブロックを発生させてもよい。このケースでは、予測情報シンタックス要素は、参照ブロックを取り出すべきDPB314中の参照ピクチャーとともに、現在ピクチャー中の現在ブロックのロケーションに対する、参照ピクチャー中の参照ブロックのロケーションを識別する動きベクトルを示していてもよい。動き補償ユニット316は、一般的に、動き補償ユニット224(図2)に関して説明した方法と実質的に類似する方法で、インター予測プロセスを実行してもよい。
【0099】
[0105]
別の例として、現在ブロックがイントラ予測されることを予測情報シンタックス要素が示している場合には、イントラ予測ユニット318は、予測情報シンタックス要素によって示されているイントラ予測モードにしたがって、予測ブロックを発生させてもよい。再度説明すると、イントラ予測ユニット318は、一般的に、イントラ予測ユニット226(図2)に関して説明した方法と実質的に類似する方法で、イントラ予測プロセスを実行してもよい。イントラ予測ユニット318は、現在ブロックに対する隣接するサンプルのデータをDPB314から取り出してもよい。
【0100】
[0106]
再構築ユニット310は、予測ブロックと残差ブロックとを使用して、現在ブロックを再構築してもよい。例えば、再構築ユニット310は、残差ブロックのサンプルを予測ブロックの対応するサンプルに加算して、現在ブロックを再構築してもよい。
【0101】
[0107]
フィルタユニット312は、再構築されたブロック上で1つ以上のフィルタ動作を実行してもよい。例えば、フィルタユニット312は、デブロッキング動作を実行して、再構築されたブロックのエッジに沿ったブロッキネスアーティファクトを低減させてもよい。フィルタユニット312の動作は、必ずしもすべての例において実行する必要はない。
【0102】
[0108]
ビデオデコーダ300は、再構築されたブロックをDPB314中に記憶させてもよい。例えば、フィルタユニット312の動作が実行されない例では、再構築ユニット310が、再構築されたブロックをDPB314に記憶させてもよい。フィルタユニット312の動作が実行される例では、フィルタユニット312が、再構築されフィルタされたブロックをDPB314に記憶させてもよい。上記で説明したように、DPB314は、イントラ予測に対する現在ピクチャーと、後続の動き補償のための以前にデコードされたピクチャーとのサンプルのような参照情報を、予測処理ユニット304に提供してもよい。さらに、ビデオデコーダ300は、図1のディスプレイデバイス118のようなディスプレイデバイス上での後続の提示のために、DPB314からデコードされたピクチャーを出力してもよい。
【0103】
[0109]
以下は、HEVCテストモデル(HM)ソフトウェアにおける変換(ユニット/ブロック)中の最後の有意(例えば、非0)係数の最後の位置(例えば、XまたはY位置)のエンコーディング/デコーディングの説明である。本開示では、変換ユニット(TU)は、一般的に、いずれかのまたはすべての色成分(例えば、YCbCr)を含むブロックを指すかもしれないが、変換ブロックは、特定の色成分を指しているブロックである。「最後の」有意係数は、変換ブロックに対して予め規定されている走査パターンに沿った、最後の有意係数であってもよい。例えば、最後の有意係数位置は、順方向走査パターンに沿った、最後の非0変換係数の位置であってもよい。ビデオデコーダ300は、変換ブロックをエントロピーデコードするときに、変換ブロック中の最後の有意係数の位置を使用して、逆走査パターンに沿った変換ブロックに対する走査プロセスを開始してもよい。
【0104】
[0110]
1つの例では、最後の位置をエンコーディングすることは、2つの部分、すなわち、バイナリ化とCABACエンコーディングとを含んでいる。同様に、最後の位置をデコーディングすることは、逆バイナリ化が続くCABACデコーディングを含むだろう。バイナリ化プロセスは、最後の有意係数の位置(例えば、XまたはY位置)をバイナリストリングに変換する。HM中で使用されるバイナリ化方法は、トランケーティドユーナリー+固定長エンコーディングである。トランケーティドユーナリーコード部分(例えば、プレフィックス)に対しては、CABACコンテキスト(例えば、確率モデル)を使用して、ビンがエンコードされる。固定長部分(例えば、サフィックス)に対しては、バイパスモード(例えば、コンテキストなし)を使用して、ビンがエンコードされる。本開示の技法は、トランケーティドユーナリーコードプレフィックスシンタックス要素のビンをエンコード/デコードする際に使用するコンテキストを決定することを伴う。32×32TU(変換ユニット/変換ブロック)に対する例示的なバイナリ化を、以下の表Iに示す。
【0105】
[0111]
表1:TU32×32に対するバイナリ化
【表1】
【0106】
[0112]
HEVCにおけるプレフィックスシンタックス要素に対するコンテキストインデックスctxInc(例えば、ビンに対して使用する特定のコンテキストを特定するインデックス)は、以下で引用されている9.3.4.2.3節において規定されている。
シンタックス要素last_sig_coeff_x_prefixおよびlast_sig_coeff_y_prefixに対するctxIncの導出プロセス
このプロセスへの入力は、変数binIdx、色成分インデックスcIdxおよび変換ブロックサイズlog2TrafoSizeである。
このプロセスの出力は、変数ctxIncである。
変数ctxOffsetおよびctxShiftは以下のように導出される。
-cIdxが0に等しい場合には、ctxOffsetは、3*(log2TrafoSize-2)+((log2TrafoSize-1)>>2)に等しく設定され、ctxShiftは、(log2TrafoSize+1)>>2に等しく設定される。
-そうではない(cIdxが0より大きい)場合には、ctxOffsetは、15に等しく設定され、ctxShiftは、log2TrafoSize-2に等しく設定される。
変数ctxIncは以下のように導出される。
ctxInc=(binIdx>>ctxShift)+ctxOffset (9-25)。
【0107】
[0113]
HEVCの上記のセクションでは、最後の有意係数位置のX位置およびY位置に対するプレフィックスシンタックス要素は、last_sig_coeff_x_prefixおよびlast_sig_coeff_y_prefixである。変数binIdxは、コード化されているビンを示している。例えば、表Iに示されているように、3の大きさを有する最後の有意係数位置は、トランケーティドユーナリーモデルプレフィックス(例えば、last_sig_coeff_x_prefixまたはlast_sig_coeff_y_prefix)において、4ビットで表される。これらの4ビットは、4つの異なるビン(例えば、ビン0、ビン1、ビン2、ビン3)としてコード化される。変数binIdxは、ビデオエンコーダ200およびビデオデコーダ300がコンテキストを決定すべき、これらのビンのうちのどれかを特定する。
【0108】
[0114]
変数cIdxは、色成分を特定するインデックスである。例えば、0に等しいcIdxは、ルーマ(Y)成分を特定し、0よりも大きいcIdxは、CrまたはCbクロマ成分のうちの1つを特定する。(例えば、1次元における)変換ブロックサイズは、変数log2TrafoSizeにより特定される。例えば、4の対数底2は2であるので、4×4変換ブロックは、2のlog2TrafoSizeを有することになる。32の対数底2は5であるので、32×32変換ブロックは、5のlog2TrafoSizeを有することになる。
【0109】
[0115]
上記の関数から出力されたコンテキスト(ctxInc)は、色成分(cIdx)と変換ブロックサイズ(log2TrafoSize)との関数として導出される、コンテキストオフセット(ctxOffset)およびコンテキストシフト(ctxShift)に基づいている。例えば、ルーマ成分(すなわち、cIdx=0)に対しては、ctxOffsetおよびctxShiftは、以下のように決定される。
cIdxが0に等しい場合には、ctxOffsetは、3*(log2TrafoSize-2)+((log2TrafoSize-1)>>2)に等しく設定され、ctxShiftは、(log2TrafoSize+1)>>2に等しく設定される。
演算子>>は論理右シフトである。その後、コンテキスト(ctxInc)が、ctxOffset、ctxShiftおよびbinIdxを使用して、以下のように決定される。
ctxInc=(binIdx>>ctxShift)+ctxOffset。
【0110】
[0116]
last_sig_coeff_x_prefixおよび/またはlast_sig_coeff_y_prefixのビンに対するコンテキストを決定するための上記の関数は、事実上、以下の導出結果をもたらす。
表II ルーマlast_significant_coeff_X_prefixコンテキスト割り当て(設定A)
【表2】
【0111】
[0117]
しかしながら、次世代ビデオコーデック(例えば、VVCおよびEVC)における大きい変換サイズの導入とともに、last_sig_coeff_x_prefixおよびlast_sig_coeff_y_prefixのビンに対するコンテキストを決定するための上記で特定された関数は、32よりも大きい変換サイズに対する一貫したパターンを提供しない。例えば、異なるTUサイズの異なるビン間で意図せずに共有されるコンテキストインデックス(太字および下線付き)を含む以下の表IIIを参照されたい。異なる変換サイズに渡る異なるビンに対して同じコンテキストを再使用することは、コンテキスト適応性が乏しいことに起因して、事実上、より低いコーディング効率をもたらすかもしれない。これは、コンテキストが、特定のビンにおける1または0の出現に対する確率モデルであることが理由である。32×32TU(または、変換ブロック)に対する最後の有意係数位置のビン6またはビン7は、典型的に、64×64TUのビン0またはビン1とははるかに異なる、0または1である確率を有することになる。このようなことから、異なる変換サイズに渡ってコンテキストを再使用することは、より低いコーディング効率、および/または、増加した歪みをもたらすかもしれない。
【0112】
[0118]
表III ルーマlast_significant_coeff_X_prefixコンテキスト割り当て(TU64x64に対する完全なバイナリ化に留意されたい)。
【表3】
【0113】
[0119]
大きい変換ブロックサイズに対するコンテキスト導出における上記で識別した欠点を考慮して、本開示は、最後の有意係数の位置を示すコンテキストコード化シンタックス要素(例えば、last_sig_coeff_x_prefixおよびlast_sig_coeff_y_prefix)のビンに対するコンテキストを決定するための技法を説明している。本開示の1つの例では、ビデオエンコーダ200およびビデオデコーダ300は、意図せず共有されるコンテキストインデックスの問題が存在しないように、別の関数(例えば、HEVCにおいて使用される関数とは異なる関数)を使用して、最後の位置コーディングにおけるビンに対するコンテキストインデックスを導出するように構成されていてもよい。本開示の例では、コンテキストインデックスを導出する「関数」は、複数のサブ関数を含んでいてもよく、異なるサイズの変換ブロックに対して各サブ関数を使用してもよい。例えば、ビデオエンコーダ200およびビデオデコーダ300は、変換ブロックのサイズの関数を使用して、変換ブロックの最後の有意係数の位置を示すシンタックス要素(例えば、last_significant_coeff_X_prefix、last_significant_coeff_Y_prefix)の1つ以上のビンに対するコンテキストを導出するために、関数を使用するように構成されていてもよく、異なるサイズの変換ブロックに対して同じコンテキストが使用されないように、関数は、コンテキストを出力する。
【0114】
[0120]
1つの例では、ビデオエンコーダ200およびビデオデコーダ300は、シンタックス要素last_sig_coeff_x_prefixおよびlast_sig_coeff_y_prefixのビンに対するコンテキストの以下の導出を使用するように構成されていてもよい。以下のものは、本開示の技法による、コンテキスト導出の例を示している。以下のコンテキスト導出の部分は、コンテキストインデックスが変換ブロックサイズに渡って意図せずに共有されないことを保証するのを助ける。これらの部分は、タグ<ADD>と</ADD>との間で、太字のイタリック体で示されている。例えば、例示的なコンテキスト導出技法は、異なるサイズの変換ブロックに対して同じでないコンテキストを決定するために、ビデオエンコーダ200またはビデオデコーダ300が使用する関数の例である。
【0115】
[0121]
シンタックス要素last_sig_coeff_x_prefixおよびlast_sig_coeff_y_prefixに対するctxIncの導出プロセス
このプロセスへの入力は、変数binIdx、色成分インデックスcIdxおよび変換ブロックサイズlog2TrafoSizeである。
このプロセスの出力は、変数ctxIncである。
cIdxが0に等しい場合には、変数ctxOffsetおよびctxShiftは以下のように導出される。
-<ADD>log2TrafoSizeXが5以下である場合には</ADD>、ctxOffsetは、3*(log2TrafoSizeX-2)+((log2TrafoSizeX-1)>>2)に等しく設定され、ctxShiftは、(log2TrafoSizeX+1)>>2に等しく設定され、変数log2TrafoSizeXは、sig_coeff_x_prefixに対するコンテキストの導出に対してlog2TrafoSizeWidthに等しく、sig_coeff_y_prefixに対するコンテキストの導出に対してlog2TrafoSizeHeightに等しい。
-<ADD>そうではない場合(log2TrafoSizeXが5より大きい場合)には</ADD>、ctxOffsetは、3*(log2TrafoSizeX-2)+((log2TrafoSizeX-1)>>2)+<ADD>((TrafoSizeX>>6)<<1)+(TrafoSizeX>>7)</ADD>に等しく設定され、ctxShiftは、(log2TrafoSizeX+1)>>2に等しく設定され、変数log2TrafoSizeXは、sig_coeff_x_prefixに対するコンテキストの導出に対してlog2TrafoSizeWidthに等しく、sig_coef_y_prefixに対するコンテキストの導出に対してlog2TrafoSizeHeightに等しい。
そうではない(cIdxが0より大きい)場合には、ctxOffsetは、25に等しく設定され、ctxShiftは、log2TrafoSizeX-<ADD>2-log2(TrafoSizeX>>4)に等しく設定され、変数TrafoSizeXは、sig_coeff_x_prefixに対してTrafoSizeWidthに等しく、sig_coef_y_prefixに対してTrafoSizeHeightに等しい</ADD>。
【0116】
[0122]
上記の式では、log2TrafoSizeWidthは、対数底2の変換ブロック幅であり、log2TrafoSizeHeightは、対数底2の変換ブロック高さである。上記で示されているように、「log2TrafoSizeXが5以下である場合には」と述べる節は、特定の寸法において32以下である変換ブロックおよび/またはTU(例えば、32×32TU、32×16TU、16×32TU等)に対するコンテキストを決定するのに使用される関数(または、関数のサブ関数)である。「そうではない場合には(log2TrafoSizeXが5より大きい場合には)」と述べる節は、特定の寸法において32より大きい変換ブロックおよび/またはTU(例えば、64×64TU、32×64TU、64×32TU等)に対するコンテキストを決定するのに使用される異なる関数(または、関数の異なるサブ関数)である。
【0117】
[0123]
上記で規定されている関数では、32以下の特定の寸法を有する変換ブロックに対して、ビデオエンコーダ200およびビデオデコーダ300は、関数3*(log2TrafoSizeX-2)+((log2TrafoSizeX-1)>>2)を使用して、ctxOffsetを決定するように構成されている。ctxOffsetに対するこの関数は、一般的に、スケールとオフセットとを有するように記述してもよい。例えば、関数は、一般的に、a*size+(b*size)として記述してもよく、a*size=(log2TrafoSizeX-2)はスケールであり、b*size=((log2TrafoSizeX-1)>>2)はオフセットである。
【0118】
[0124]
32よりも大きい特定の寸法(例えば、64)を有する変換ブロックに対して、ビデオエンコーダ200およびビデオデコーダ300は、関数3*(log2TrafoSizeX-2)+((log2TrafoSizeX-1)>>2)+((TrafoSizeX>>6)<<1)+(TrafoSizeX>>7)を使用して、ctxOffsetを決定するように構成されている。すなわち、32よりも大きい特定の寸法(例えば、64)を有する変換ブロックに対して、コンテキストオフセットを決定するための関数は、スケールと、オフセットと、ビットシフトとクリッピングとを伴うサイズ依存オフセットとの形態をとる、線形演算と非線形演算との組み合わせであってもよい。例えば、関数は、一般的に、a*size+(b*size2+c(size))+d(size)として記述してもよい。この例では、a*sizeおよびb*sizeは、上記で規定されているものと同じであり、c(size)は(TrafoSizeX>>6)<<1であり、d(size)は(TrafoSizeX>>7)である。関数のc(size)およびd(size)部分は、ビットシフトとクリッピングとを伴うサイズ依存オフセットであると考えてもよく、関数の非線形部分である。
【0119】
[0125]
以下の表IVは、異なるビンのコンテキストインデックスを共有しない、さまざまなTUブロックサイズに対するコンテキストインデックスのフラグメント(TU64×64に対する不完全な結果)を示している。
表IV ルーマlast_significant_coeff_X_prefixコンテキスト割り当て(設定A)
【表4】
【0120】
[0126]
上記を考慮すると、ビデオデコーダ300(例えば、図3のエントロピーデコーディングユニット302)は、以下の技法のうちの1つ以上を使用して、最後の有意係数の位置を示すシンタックス要素のビンをエントロピーデコードするためのコンテキストを決定するように構成されていてもよい。ビデオデコーダ300を参照して説明しているが、ビデオエンコーダ200(例えば、図2のエントロピーエンコーディングユニット220)も、最後の有意係数の位置を示すシンタックス要素のビンをエントロピーエンコードするためのコンテキストを決定する逆の技法を実行するように構成されていてもよいことを理解されたい。
【0121】
[0127]
本開示の1つの例では、ビデオデコーダ300は、ビデオデータの現在ブロックに対するエントロピーコード化データを受信するように構成されていてもよく、エントロピーコード化データは、現在ブロックの変換ブロック中の最後の有意係数の位置を示すシンタックス要素に対するエントロピーコード化データを含んでいる。例えば、変換ブロック中の最後の有意係数の位置を示すシンタックス要素に対するエントロピーコード化データは、last_sig_coeff_x_prefixシンタックス要素および/またはlast_sig_coeff_y_prefixシンタックス要素のエントロピーエンコードされたビンであってもよい。
【0122】
[0128]
ビデオデコーダ300は、変換ブロックのサイズの関数を使用して、最後の有意係数の位置を示すシンタックス要素のエントロピーコード化データの1つ以上のビンのそれぞれに対するそれぞれのコンテキストを決定するようにさらに構成されていてもよい。すなわち、ビデオデコーダ300は、受信されたシンタックス要素のエントロピーエンコードされたビンのそれぞれに対するコンテキストを決定する。表I中において上記で示されているように、最後の位置の異なる大きさは、異なる数のビンを使用してコード化されてもよい。ビデオデコーダ300は、ビンのそれぞれに対するコンテキストを決定する。本開示の技法によれば、異なるサイズの変換ブロックに対して同じコンテキストが使用されないように、それぞれのコンテキストを決定するためにビデオデコーダ300により使用される(変換ブロックのサイズに依存する異なるサブ関数を含んでいてもよい)関数は、それぞれのコンテキストを出力する。ビデオデコーダ300は、その後、決定されたそれぞれのコンテキストを使用して、最後の有意係数の位置を示すシンタックス要素に対するエントロピーコード化データをデコードしてもよい。
【0123】
[0129]
1つの例では、ビデオデコーダ300は、64サンプル寸法変換ブロックに対するエントロピーコード化データをエントロピーデコードするように構成されていてもよい。すなわち、変換ブロックは、ブロックの高さおよび/または幅で64サンプルのサイズを有している。例えば、ビデオデコーダ300は、64サンプル幅を有する変換ブロックに対してlast_sig_coeff_x_prefixシンタックス要素に対するコンテキストを決定してもよい。同様に、ビデオデコーダ300は、64サンプル高さを有する変換ブロックに対してlast_sig_coeff_y_prefixシンタックス要素に対するコンテキストを決定してもよい。
【0124】
[0130]
この例では、ビデオデコーダ300は、64サンプル寸法変換ブロックに対する第1の関数を使用して、最後の有意係数の位置を示すシンタックス要素のエントロピーコード化データの1つ以上のビンのそれぞれに対するそれぞれのコンテキストを決定するように構成されていてもよい。上記の例示的な導出では、64サンプル寸法変換ブロックに対する第1の関数は、以下の通りである。
ctxOffsetは、3*(log2TrafoSizeX-2)+((log2TrafoSizeX-1)>>2)+((TrafoSizeX>>6)<<1)+(TrafoSizeX>>7)に等しく設定され、ctxShiftは、(log2TrafoSizeX+1)>>2に等しく設定され、変数log2TrafoSizeXは、sig_coeff_x_prefixに対するコンテキストの導出に対してlog2TrafoSizeWidthに等しく、sig_coef_y_prefixに対するコンテキストの導出に対してlog2TrafoSizeHeightに等しい。
【0125】
[0131]
ビデオデコーダ300は、その後、以下の式を使用して、それぞれのビンに対する特定のコンテキスト(ctxInc)を決定してもよい。
ctxInc=(binIdx>>ctxShift)+ctxOffset。
【0126】
[0132]
この例では、64サンプル寸法変換ブロックに対して使用される第1の関数は、32サンプル寸法変換ブロックに対する最後の有意係数の位置を示すシンタックス要素のエントロピーコード化データの1つ以上のビンのそれぞれに対するそれぞれのコンテキストを決定するのに使用される第2の関数とは異なる。上記の例では、32サンプル寸法変換ブロックに対する第2の関数は、以下の通りである。
ctxOffsetは、3*(log2TrafoSizeX-2)+((log2TrafoSizeX-1)>>2)に等しく設定され、ctxShiftは、(log2TrafoSizeX+1)>>2に等しく設定され、変数log2TrafoSizeXは、sig_coeff_x_prefixに対するコンテキストの導出に対してlog2TrafoSizeWidthに等しく、sig_coef_y_prefixに対するコンテキストの導出に対してlog2TrafoSizeHeightに等しい。
【0127】
[0133]
再度説明すると、ビデオデコーダ300は、その後、以下の式を使用して、それぞれのビンに対する特定のコンテキスト(ctxInc)を決定してもよい。
ctxInc=(binIdx>>ctxShift)+ctxOffset。
【0128】
[0134]
当然ながら、異なるサイズの変換ブロックに対して同じコンテキストが使用されないように、関数がそれぞれのコンテキストを出力する限り、ビデオデコーダ300は、本開示の技法にしたがって、32サンプル寸法および64サンプル寸法の変換ブロックに対して、異なる関数を使用するように構成されていてもよい。
【0129】
[0135]
上記の関数および式から分かるように、変換ブロックのサイズの関数を使用して、最後の有意係数の位置を示すシンタックス要素のエントロピーコード化データの1つ以上のビンのそれぞれに対するそれぞれのコンテキストを決定するために、ビデオデコーダ300は、変換ブロックのサイズの関数と色成分インデックスとを使用して、それぞれのコンテキストオフセット(ctxOffset)とそれぞれのコンテキストシフト(ctxShift)とを決定し、それぞれのビンに対するビンインデックス(binIdx)と、それぞれのコンテキストオフセットと、それぞれのコンテキストシフトとを使用して、1つ以上のビンのそれぞれのビンに対するそれぞれのコンテキストを決定するように構成されていてもよい。
【0130】
[0136]
表Iに戻って参照すると、本開示の技法にしたがってビデオデコーダ300によりエントロピーデコードされるシンタックス要素は、最後の有意係数の位置のX位置を示す第1のプレフィックスシンタックス要素(例えば、sig_coeff_x_prefix)、または、最後の有意係数の位置のY位置を示す第2のプレフィックスシンタックス要素(例えば、sig_coeff_y_prefix)のうちの1つである。このようなことから、決定されたそれぞれのコンテキストを使用して、最後の有意係数の位置を示すシンタックス要素に対するエントロピーコード化データをデコードするために、ビデオデコーダ300は、決定されたそれぞれのコンテキストを使用して、第1のプレフィックスシンタックス要素と第2のプレフィックスシンタックス要素の両方に対するエントロピーコード化データをデコードするように構成されていてもよい。
【0131】
[0137]
sig_coeff_x_prefixシンタックス要素およびsig_coeff_y_prefixシンタックス要素が、プレフィックスシンタックス要素であるとすると、ビデオデコーダ300は、sig_coeff_x_prefixシンタックス要素およびsig_coeff_y_prefixシンタックス要素のそれぞれに対応する固定長デコーディング(例えば、表Iの固定バイナリ部分)を使用して、それぞれのサフィックスシンタックス要素をデコードし、プレフィックスシンタックス要素と第1のサフィックスシンタックス要素とを逆バイナリ化して、変換ブロック中の最後の有意係数の位置(例えば、X位置またはY位置)を取得するようにさらに構成されていてもよい。
【0132】
[0138]
上記で説明したように、ビデオデコーダ300は、その後、決定されたそれぞれのコンテキストを使用して、最後の有意係数の位置を示すシンタックス要素に対するエントロピーコード化データをデコードしてもよい。例えば、ビデオデコーダ300は、最後の有意係数の位置に基づいて変換ブロックをデコードして、変換係数を取得し、変換係数に逆変換を適用して、残差ブロックを取得し、現在ブロックに対する予測プロセス(例えば、インター予測またはイントラ予測)を実行して、予測ブロックを取得し、残差ブロックを予測ブロックに加算して、ビデオデータのデコードされたブロックを取得してもよい。
【0133】
[0139]
以下は、コンテキスト導出のための別の例である。以下の例示的な導出では、ビデオエンコーダ200およびビデオデコーダ300は、32サンプル寸法以下を有する(log2TrafoSizeXが5以下である場合)変換ブロックに対して1つの関数を、64サンプル寸法を有する(そうではない場合(log2TrafoSizeXが6に等しい場合))変換ブロックに対して別の関数を、128サンプル寸法を有する(そうではない場合(log2TrafoSizeXが7に等しい場合))変換ブロックに対してさらに別の関数を使用してもよい。再度説明すると、コンテキストインデックスが意図せずに共有されないことを保証するのを助ける以下のコンテキスト導出の部分は、タグ<ADD>と</ADD>との間で、太字のイタリック体で示されている。
【0134】
[0140]
cIdxが0に等しい場合には、変数ctxOffsetおよびctxShiftは、以下のように導出される。
-<ADD>log2TrafoSizeXが5以下である場合には</ADD>、ctxOffsetは、3*(log2TrafoSizeX-2)+((log2TrafoSizeX-1)>>2)に等しく設定され、ctxShiftは、(log2TrafoSizeX+1)>>2に等しく設定され、変数log2TrafoSizeXは、sig_coeff_x_prefixに対するコンテキストの導出に対してlog2TrafoSizeWidthに等しく、sig_coef_y_prefixに対するコンテキストの導出に対してlog2TrafoSizeHeightに等しい。
-<ADD>そうではない場合には(log2TrafoSizeXが6に等しい場合には)</ADD>、ctxOffsetは、3*(log2TrafoSizeX-2)+((log2TrafoSizeX-1)>>2)+2に等しく設定され、ctxShiftは、(log2TrafoSizeX+1)>>2に等しく設定され、変数log2TrafoSizeXは、sig_coeff_x_prefixに対するコンテキストの導出に対してlog2TrafoSizeWidthに等しく、sig_coef_y_prefixに対するコンテキストの導出に対してlog2TrafoSizeHeightに等しい。
-<ADD>そうではない場合には(log2TrafoSizeXが7に等しい場合には)</ADD>、ctxOffsetは、3*(log2TrafoSizeX-2)+((log2TrafoSizeX-1)>>2)+5に等しく設定され、ctxShiftは、(log2TrafoSizeX+1)>>2に等しく設定され、変数log2TrafoSizeXは、sig_coeff_x_prefixに対するコンテキストの導出に対してlog2TrafoSizeWidthに等しく、sig_coef_y_prefixに対するコンテキストの導出に対してlog2TrafoSizeHeightに等しい。
そうではない(cIdxが0より大きい)場合には、ctxOffsetは、25に等しく設定され、ctxShiftは、log2TrafoSizeX-<ADD>2-log2(TrafoSizeX>>4)に等しく設定され、変数TrafoSizeXは、sig_coeff_x_prefixに対するコンテキストの導出に対してTrafoSizeWidthに等しく、sig_coef_y_prefixに対するコンテキストの導出に対してTrafoSizeHeightに等しい。
【0135】
[0141]
したがって、本開示の別の例では、現在ブロックに対する変換ブロックは、128サンプル寸法変換ブロックである。この例では、変換ブロックのサイズの関数を使用して、最後の有意係数の位置を示すシンタックス要素のエントロピーコード化データの1つ以上のビンのそれぞれに対するそれぞれのコンテキストを決定するために、ビデオデコーダ300は、128サンプル寸法変換ブロックに対する第1の関数を使用して、最後の有意係数の位置を示すシンタックス要素のエントロピーコード化データの1つ以上のビンのそれぞれに対するそれぞれのコンテキストを決定するように構成されていてもよい。この例では、第1の関数は、64サンプル寸法変換ブロックに対する最後の有意係数の位置を示すシンタックス要素のエントロピーコード化データの1つ以上のビンのそれぞれに対するそれぞれのコンテキストを決定するのに使用される第2の関数とは異なり、第1の関数は、32サンプル寸法変換ブロックに対する最後の有意係数の位置を示すシンタックス要素のエントロピーコード化データの1つ以上のビンのそれぞれに対するそれぞれのコンテキストを決定するのに使用される第3の関数とは異なる。
【0136】
[0142]
上記を考慮すると、本開示の1つの例では、ビデオデコーダ300は、ビデオデータの現在ブロックに対するエントロピーコード化データを受信し、エントロピーコード化データは、現在ブロックの変換ブロック中の最後の有意係数の位置を示すシンタックス要素に対するエントロピーコード化データを含み、変換ブロックのサイズの関数を使用して、最後の有意係数の位置を示すシンタックス要素の1つ以上のビンに対するコンテキストを決定し、異なるサイズの変換ブロックに対して同じコンテキストが使用されないように、関数は、コンテキストを出力し、決定されたコンテキストを使用して、最後の有意係数の位置を示すシンタックス要素に対するエントロピーコード化データをデコードするように構成されていてもよい。
【0137】
[0143]
1つの例では、関数はさらに、ビンインデックスと色成分インデックスとに基づいている。
【0138】
[0144]
同様に、ビデオエンコーダ200は、ビデオデータの現在ブロックの変換ブロック中の最後の有意係数の位置を示すシンタックス要素を決定し、シンタックス要素を1つ以上のビンにバイナリ化し、変換ブロックのサイズの関数を使用して、最後の有意係数の位置を示すシンタックス要素の1つ以上のビンに対するコンテキストを決定し、異なるサイズの変換ブロックに対して同じコンテキストが使用されないように、関数は、コンテキストを出力し、決定されたコンテキストを使用して、最後の有意係数の位置を示すシンタックス要素の1つ以上のビンをエントロピーエンコードするように構成されていてもよい。
【0139】
[0145]
1つの例では、関数はさらに、ビンインデックスと色成分インデックスとに基づいている。
【0140】
[0146]
図4は、現在ブロックをエンコードするための例示的な方法を図示するフローチャートである。現在ブロックは、現在CUを含んでいてもよい。ビデオエンコーダ200(図1および図2)に関して説明するが、図4の方法と類似する方法を実行するように他のデバイスが構成されてもよいことを理解されたい。
【0141】
[0147]
この例では、ビデオエンコーダ200は、最初に現在ブロックを予測する(350)。例えば、ビデオエンコーダ200は、現在ブロックに対する予測ブロックを形成してもよい。ビデオエンコーダ200は、その後、現在ブロックに対する残差ブロックを計算してもよい。(352)。残差ブロックを計算するために、ビデオエンコーダ200は、現在ブロックに対する元のエンコードされていないブロックと予測ブロックとの間の差分を計算してもよい。ビデオエンコーダ200は、その後、残差ブロックの係数を変換および量子化してもよい(354)。次に、ビデオエンコーダ200は、残差ブロックの量子化された変換係数を走査してもよい(356)。走査の間、または、走査に続いて、ビデオエンコーダ200は、係数および他のシンタックス要素をエントロピーエンコードしてもよい(358)。例えば、ビデオエンコーダ200は、CAVLCまたはCABACを使用して、係数をエンコードしてもよい。1つの例として、ビデオエンコーダ200は、本開示で説明されている例示的な技法を使用して、最後の有意係数の位置を示すシンタックス要素の1つ以上のビンに対するコンテキストを決定してもよい。追加の詳細は、図5で説明する。ビデオエンコーダ200は、その後、ブロックのエントロピーエンコードされたデータを出力してもよい(360)。
【0142】
[0148]
図5は、例示的なエントロピーエンコーディング方法を図示しているフローチャートである。図5は、図4のプロセス358の態様をより詳細に示している。ビデオエンコーダ200は、ビデオデータの現在ブロックの変換ブロック中の最後の有意係数の位置を示すシンタックス要素を決定し(500)、シンタックス要素を1つ以上のビンにバイナリ化する(502)ように構成されていてもよい。ビデオエンコーダ200は、変換ブロックのサイズの関数を使用して、最後の有意係数の位置を示すシンタックス要素の1つ以上のビンのそれぞれに対するそれぞれのコンテキストを決定するようにさらに構成されていてもよく、異なるサイズの変換ブロックに対して同じコンテキストが使用されないように、関数は、コンテキストを出力する(504)。ビデオエンコーダ200は、その後、決定されたそれぞれのコンテキストを使用して、最後の有意係数の位置を示すシンタックス要素の1つ以上のビンをエントロピーエンコードしてもよい(506)。
【0143】
[0149]
図6は、ビデオデータの現在ブロックをデコードするための例示的な方法を図示するフローチャートである。現在ブロックは、現在CUを含んでいてもよい。ビデオデコーダ300(図1および図3)に関して説明するが、図6の方法と類似する方法を実行するように他のデバイスが構成されてもよいことを理解されたい。
【0144】
[0150]
ビデオデコーダ300は、現在ブロックに対応する残差ブロックの係数に対する、エントロピーコード化予測情報およびエントロピーコード化データのような、現在ブロックに対するエントロピーコード化データを受け取ってもよい(370)。ビデオデコーダ300は、エントロピーコード化データをエントロピーデコードして、現在ブロックに対する予測情報を決定し、残差ブロックの係数を再生させてもよい(372)。1つの例として、ビデオデコーダ300は、本開示で説明されている例示的な技法を使用して、最後の有意係数の位置を示すシンタックス要素の1つ以上のビンに対するコンテキストを決定してもよい。
【0145】
[0151]
ビデオデコーダ300は、例えば、現在ブロックに対する予測情報により示されているイントラ予測モードまたはインター予測モードを使用して現在ブロックを予測して、現在ブロックに対する予測ブロックを計算してもよい(374)。ビデオデコーダ300は、その後、再生された係数を逆走査して、量子化された係数のブロックを生成させてもよい(376)。ビデオデコーダ300は、その後、係数を逆量子化および逆変換して、残差ブロックを生成させてもよい(378)。ビデオデコーダ300は、最終的に、予測ブロックと残差ブロックとを組み合わせることにより、現在ブロックをデコードしてもよい(380)。
【0146】
[0152]
図7は、例示的なエントロピーデコーディング法を図示しているフローチャートである。図7は、図6のプロセス372の態様をより詳細に示している。
【0147】
[0153]
例えば、ビデオデコーダ300は、ビデオデータの現在ブロックに対するエントロピーコード化データを受信するように構成されていてもよく、エントロピーコード化データは、現在ブロックの変換ブロック中の最後の有意係数の位置を示すシンタックス要素に対するエントロピーコード化データを含んでいる(700)。ビデオデコーダ300は、変換ブロックのサイズの関数を使用して、最後の有意係数の位置を示すシンタックス要素のエントロピーコード化データの1つ以上のビンのそれぞれに対するそれぞれのコンテキストを決定してもよく、異なるサイズの変換ブロックに対して同じコンテキストが使用されないように、関数は、それぞれのコンテキストを出力する(702)。ビデオデコーダ300は、その後、決定されたそれぞれのコンテキストを使用して、最後の有意係数の位置を示すシンタックス要素に対するエントロピーコード化データをデコードしてもよい(704)。
【0148】
[0154]
以下は、本開示の追加の例示的な例である。
【0149】
[0155]
例1-ビデオデータをデコードする方法において、方法は、ビデオデータの現在ブロックに対するエントロピーコード化データを受信し、エントロピーコード化データは、現在ブロックの変換ブロック中の最後の有意係数の位置を示すシンタックス要素に対するエントロピーコード化データを含むことと、変換ブロックのサイズの関数を使用して、最後の有意係数の位置を示すシンタックス要素の1つ以上のビンに対するコンテキストを決定し、異なるサイズの変換ブロックに対して同じコンテキストが使用されないように、関数は、コンテキストを出力することと、決定されたコンテキストを使用して、最後の有意係数の位置を示すシンタックス要素に対するエントロピーコード化データをデコードすることとを含んでいる。
【0150】
[0156]
例2-関数は、ビンインデックスと色成分インデックスとにさらに基づいている例1記載の方法。
【0151】
[0157]
例3-ビデオデータをエンコードする方法において、方法は、ビデオデータの現在ブロックの変換ブロック中の最後の有意係数の位置を示すシンタックス要素を決定することと、シンタックス要素を1つ以上のビンにバイナリ化することと、変換ブロックのサイズの関数を使用して、最後の有意係数の位置を示すシンタックス要素の1つ以上のビンに対するコンテキストを決定し、異なるサイズの変換ブロックに対して同じコンテキストが使用されないように、関数は、コンテキストを出力することと、決定されたコンテキストを使用して、最後の有意係数の位置を示すシンタックス要素の1つ以上のビンをエントロピーエンコードすることとを含んでいる。
【0152】
[0158]
例4-関数は、ビンインデックスと色成分インデックスとにさらに基づいている例3記載の方法。
【0153】
[0159]
例5-ビデオデータをコード化するデバイスにおいて、デバイスは、例1~4のいずれかの方法を実行する1つ以上の手段を具備している。
【0154】
[0160]
例6-1つ以上の手段が、回路中で実現されている1つ以上のプロセッサを備えている例5記載のデバイス。
【0155】
[0161]
例7-ビデオデータを記憶するメモリをさらに具備している例5および6のいずれかのデバイス。
【0156】
[0162]
例8-デコードされたビデオデータを表示するように構成されているディスプレイをさらに具備している例5~7のいずれか記載のデバイス。
【0157】
[0163]
例9-デバイスは、カメラ、コンピュータ、移動体デバイス、ブロードキャスト受信機デバイス、または、セットトップボックスのうちの1つ以上を備えている例5~8のいずれかのデバイス。
【0158】
[0164]
例10-デバイスは、ビデオデコーダを備えている例5~9のいずれか記載のデバイス。
【0159】
[0165]
例11-デバイスは、ビデオエンコーダを備えている例5~10のいずれか記載のデバイス。
【0160】
[0166]
例12-実行されるときに、1つ以上のプロセッサに、例1~4のいずれかの方法を実行させる命令を記憶しているコンピュータ読取可能記憶媒体。
【0161】
[0167]
例に依存して、ここで説明した技法のうちのいずれかのある動作またはイベントは、異なるシーケンスで実行でき、追加してもよく、マージしてもよく、または、完全に省略してもよい(例えば、説明した動作またはイベントのすべてが本技法の実施のために必要であるとは限らない)ことを認識されたい。さらに、ある例では、動作またはイベントは、シーケンシャルによりもむしろ、例えば、マルチスレッド処理、割り込み処理、または、複数のプロセッサを通して、同時に実行してもよい。
【0162】
[0168]
1つ以上の例において、説明した機能は、ハードウェア、ソフトウェア、ファームウェア、または、これらの任意の組み合わせで実現してもよい。ソフトウェアで実現される場合には、機能は、1つ以上の命令またはコードとしてコンピュータ読取可能媒体上に記憶されていてもよく、あるいは、1つ以上の命令またはコードとしてコンピュータ読取可能媒体上で送信されてもよく、ハードウェアベースの処理ユニットによって実行してもよい。コンピュータ読取可能媒体はまた、例えば、通信プロトコルにしたがって、コンピュータプログラムの1つの場所から別の場所への転送を容易にする何らかの媒体を含む通信媒体、または、データ記憶媒体のような有形の媒体に対応するコンピュータ読取可能記憶媒体を含んでいてもよい。このように、コンピュータ読取可能媒体は、一般的に、(1)有形コンピュータ読取可能記憶媒体、または、(2)信号または搬送波のような通信媒体に対応していてもよい。データ記憶媒体は、本開示で説明した技法を実現するための命令、コードおよび/またはデータ構造を取り出すために、1つ以上のコンピュータまたは1つ以上のプロセッサによってアクセスすることができる任意の利用可能な媒体であってもよい。コンピュータプログラム製品は、コンピュータ読取可能媒体を含んでいてもよい。
【0163】
[0169]
限定ではなく例として、このようなコンピュータ読取可能記憶媒体は、RAM、ROM、EEPROM(登録商標)、CD-ROMまたは他の光学ディスク記憶媒体、磁気ディスク記憶媒体または他の磁気記憶デバイス、フラッシュメモリ、あるいは、命令またはデータ構造の形態で望ましいプログラムコードを記憶するために使用され、コンピュータによってアクセスすることができる他の何らかの媒体を備えることができる。また、任意の接続は、コンピュータ読取可能媒体と適切に呼ばれる。例えば、命令が、ウェブサイトから、サーバから、あるいは、同軸ケーブル、光ファイバケーブル、撚り対、デジタル加入者線(DSL)、または、赤外線、無線、マイクロ波のようなワイヤレステクノロジーを使用している他の遠隔ソースから送信される場合には、同軸ケーブル、光ファイバケーブル、撚り対、DSL、または、赤外線、無線およびマイクロ波のようなワイヤレステクノロジーは、媒体の定義に含まれる。しかしながら、コンピュータ読取可能記憶媒体およびデータ記憶媒体は、接続、搬送波、信号、または、他の一時的な媒体を含まないが、代わりに、非一時的な、有形の記憶媒体に向けられていることを理解すべきである。ここで使用するようなディスク(diskおよびdisc)は、コンパクトディスク(CD)、レーザーディスク(登録商標)、光ディスク、デジタル汎用ディスク(DVD)、フロッピー(登録商標)ディスク、および、ブルーレイ(登録商標)ディスクを含むが、通常、ディスク(disk)はデータを磁気的に再生する一方で、ディスク(disc)はデータをレーザにより光学的に再生する。上記の組み合わせも、コンピュータ読取可能媒体の範囲内に含むべきである。
【0164】
[0170]
命令は、1つ以上のデジタル信号プロセッサ(DSP)、汎用マイクロプロセッサ、特定用途集積回路(ASIC)、フィールドプログラマブルゲートアレイ(FPGA)、または、他の同等な集積またはディスクリート論理回路のような1つ以上のプロセッサによって実行してもよい。したがって、ここで使用されるように、用語「プロセッサ」および「処理回路」は、前述の構造、または、ここで説明した技術のインプリメンテーションに適した他の何らかの構造のいずれかを指していてもよい。加えて、いくつかの態様では、ここで説明した機能性は、エンコードおよびデコードするように構成されている専用のハードウェアおよび/またはソフトウェアモジュール内に提供してもよく、あるいは、組み合わされたコーデック中に組み込んでもよい。また、技法は、1つ以上の回路または論理エレメントにおいて、完全に実現することができる。
【0165】
[0171]
本開示の技法は、ワイヤレスハンドセット、集積回路(IC)またはICのセット(例えば、チップセット)を含む、幅広い種類のデバイスまたは装置において実施してもよい。さまざまなコンポーネント、モジュール、または、ユニットは、開示した技法を実行するように構成されているデバイスの機能的な態様を強調するためにここ説明しているが、それらは、異なるハードウェアユニットによる実現を必ずしも要求するわけではない。むしろ、上記で説明したように、さまざまなユニットは、コーデックハードウェアユニットにおいて組み合わされるか、または、適切なソフトウェアおよび/またはファームウェアとともに、上記で説明したような1つ以上のプロセッサを含む、相互動作可能ハードウェアユニットの集合によって提供されてもよい。
【0166】
[0172]
さまざまな例を説明してきた。これらおよび他の例は、以下の特許請求の範囲の範囲内にある。
以下に本願の出願当初の特許請求の範囲に記載された発明を付記する。
[C1]
ビデオデータをデコードする方法において、
前記ビデオデータの現在ブロックに対するエントロピーコード化データを受信し、前記エントロピーコード化データは、前記現在ブロックの変換ブロック中の最後の有意係数の位置を示すシンタックス要素に対するエントロピーコード化データを含むことと、
前記変換ブロックのサイズの関数を使用して、前記最後の有意係数の位置を示す前記シンタックス要素の前記エントロピーコード化データの1つ以上のビンのそれぞれに対するそれぞれのコンテキストを決定し、異なるサイズの変換ブロックに対して同じコンテキストが使用されないように、前記関数は、前記それぞれのコンテキストを出力することと、
前記決定されたそれぞれのコンテキストを使用して、前記最後の有意係数の位置を示す前記シンタックス要素に対する前記エントロピーコード化データをデコードすることとを含む方法。
[C2]
前記現在ブロックに対する変換ブロックが、64サンプル寸法変換ブロックであり、前記関数は、線形演算と非線形演算とを含むC1記載の方法。
[C3]
前記非線形演算が、ビットシフトとクリッピングとを有するサイズ依存オフセットを含むC2記載の方法。
[C4]
前記現在ブロックに対する変換ブロックが、64サンプル寸法変換ブロックであり、
前記変換ブロックのサイズの関数を使用して、前記最後の有意係数の位置を示す前記シンタックス要素の前記エントロピーコード化データの前記1つ以上のビンのそれぞれに対する前記それぞれのコンテキストを決定することは、
前記64サンプル寸法変換ブロックに対する第1の関数を使用して、前記最後の有意係数の位置を示す前記シンタックス要素の前記エントロピーコード化データの前記1つ以上のビンのそれぞれに対する前記それぞれのコンテキストを決定し、前記第1の関数は、32サンプル寸法変換ブロックに対する最後の有意係数の位置を示すシンタックス要素のエントロピーコード化データの1つ以上のビンのそれぞれに対するそれぞれのコンテキストを決定するのに使用される第2の関数とは異なることを含むC1記載の方法。
[C5]
前記変換ブロックのサイズの関数を使用して、前記最後の有意係数の位置を示す前記シンタックス要素の前記エントロピーコード化データの前記1つ以上のビンのそれぞれに対する前記それぞれのコンテキストを決定することは、
前記変換ブロックのサイズの関数と色成分インデックスとを使用して、それぞれのコンテキストオフセットとそれぞれのコンテキストシフトとを決定することと、
前記それぞれのビンに対するビンインデックスと、前記それぞれのコンテキストオフセットと、前記それぞれのコンテキストシフトとを使用して、前記1つ以上のビンのそれぞれのビンに対する前記それぞれのコンテキストを決定することとを含むC1記載の方法。
[C6]
前記シンタックス要素が、前記最後の有意係数の位置のX位置を示す第1のプレフィックスシンタックス要素、または、前記最後の有意係数の位置のY位置を示す第2のプレフィックスシンタックス要素のうちの1つであり、
前記決定されたそれぞれのコンテキストを使用して、前記最後の有意係数の位置を示す前記シンタックス要素に対する前記エントロピーコード化データをデコードすることは、
前記決定されたそれぞれのコンテキストを使用して、前記第1のプレフィックスシンタックス要素または前記第2のプレフィックスシンタックス要素に対する前記エントロピーコード化データをデコードすることを含むC1記載の方法。
[C7]
固定長デコーディングを使用して、第1のサフィックスシンタックス要素をデコードすることと、
前記第1のプレフィックスシンタックス要素と前記第1のサフィックスシンタックス要素とを逆バイナリ化して、前記最後の有意係数の位置を取得することとをさらに含むC6記載の方法。
[C8]
前記現在ブロックに対する変換ブロックが、128サンプル寸法変換ブロックであり、
前記変換ブロックのサイズの関数を使用して、前記最後の有意係数の位置を示す前記シンタックス要素の前記エントロピーコード化データの前記1つ以上のビンのそれぞれに対する前記それぞれのコンテキストを決定することは、
前記128サンプル寸法変換ブロックに対する第1の関数を使用して、前記最後の有意係数の位置を示す前記シンタックス要素の前記エントロピーコード化データの前記1つ以上のビンのそれぞれに対する前記それぞれのコンテキストを決定し、前記第1の関数は、64サンプル寸法変換ブロックに対する最後の有意係数の位置を示すシンタックス要素のエントロピーコード化データの1つ以上のビンのそれぞれに対するそれぞれのコンテキストを決定するのに使用される第2の関数とは異なり、前記第1の関数は、32サンプル寸法変換ブロックに対する最後の有意係数の位置を示すシンタックス要素のエントロピーコード化データの1つ以上のビンのそれぞれに対するそれぞれのコンテキストを決定するのに使用される第3の関数とは異なるC1記載の方法。
[C9]
前記最後の有意係数の位置に基づいて、前記変換ブロックをデコードして、変換係数を取得することと、
前記変換係数に逆変換を適用して、残差ブロックを取得することと、
前記現在ブロックに対する予測プロセスを実行して、予測ブロックを取得することと、
前記残差ブロックを前記予測ブロックに加算して、ビデオデータのデコードされたブロックを取得することとをさらに含むC1記載の方法。
[C10]
前記ビデオデータのデコードされたブロックを含むピクチャーを表示することをさらに含むC9記載の方法。
[C11]
ビデオデータをデコードするように構成されている装置において、
前記ビデオデータの現在ブロックを記憶するように構成されているメモリと、
前記メモリと通信する1つ以上のプロセッサとを具備し、
前記1つ以上のプロセッサは、
前記ビデオデータの現在ブロックに対するエントロピーコード化データを受信し、前記エントロピーコード化データは、前記現在ブロックの変換ブロック中の最後の有意係数の位置を示すシンタックス要素に対するエントロピーコード化データを含むようにと、
前記変換ブロックのサイズの関数を使用して、前記最後の有意係数の位置を示す前記シンタックス要素の前記エントロピーコード化データの1つ以上のビンのそれぞれに対するそれぞれのコンテキストを決定し、異なるサイズの変換ブロックに対して同じコンテキストが使用されないように、前記関数は、前記それぞれのコンテキストを出力するようにと、
前記決定されたそれぞれのコンテキストを使用して、前記最後の有意係数の位置を示す前記シンタックス要素に対する前記エントロピーコード化データをデコードするように構成されている装置。
[C12]
前記現在ブロックに対する変換ブロックが、64サンプル寸法変換ブロックであり、前記関数は、線形演算と非線形演算とを含むC11記載の装置。
[C13]
前記非線形演算が、ビットシフトとクリッピングとを有するサイズ依存オフセットを含むC12記載の装置。
[C14]
前記現在ブロックに対する変換ブロックが、64サンプル寸法変換ブロックであり、
前記変換ブロックのサイズの関数を使用して、前記最後の有意係数の位置を示す前記シンタックス要素の前記エントロピーコード化データの前記1つ以上のビンのそれぞれに対する前記それぞれのコンテキストを決定するために、前記1つ以上のプロセッサは、
前記64サンプル寸法変換ブロックに対する第1の関数を使用して、前記最後の有意係数の位置を示す前記シンタックス要素の前記エントロピーコード化データの前記1つ以上のビンのそれぞれに対する前記それぞれのコンテキストを決定し、前記第1の関数は、32サンプル寸法変換ブロックに対する最後の有意係数の位置を示すシンタックス要素のエントロピーコード化データの1つ以上のビンのそれぞれに対するそれぞれのコンテキストを決定するのに使用される第2の関数とは異なるようにさらに構成されているC11記載の装置。
[C15]
前記変換ブロックのサイズの関数を使用して、前記最後の有意係数の位置を示す前記シンタックス要素の前記エントロピーコード化データの前記1つ以上のビンのそれぞれに対する前記それぞれのコンテキストを決定するために、前記1つ以上のプロセッサは、
前記変換ブロックのサイズの関数と色成分インデックスとを使用して、それぞれのコンテキストオフセットとそれぞれのコンテキストシフトとを決定するようにと、
前記それぞれのビンに対するビンインデックスと、前記それぞれのコンテキストオフセットと、前記それぞれのコンテキストシフトとを使用して、前記1つ以上のビンのそれぞれのビンに対する前記それぞれのコンテキストを決定するようにさらに構成されているC11記載の装置。
[C16]
前記シンタックス要素が、前記最後の有意係数の位置のX位置を示す第1のプレフィックスシンタックス要素、または、前記最後の有意係数の位置のY位置を示す第2のプレフィックスシンタックス要素のうちの1つであり、
前記決定されたそれぞれのコンテキストを使用して、前記最後の有意係数の位置を示す前記シンタックス要素に対する前記エントロピーコード化データをデコードするために、前記1つ以上のプロセッサは、
前記決定されたそれぞれのコンテキストを使用して、前記第1のプレフィックスシンタックス要素または前記第2のプレフィックスシンタックス要素に対する前記エントロピーコード化データをデコードするようにさらに構成されているC11記載の装置。
[C17]
前記1つ以上のプロセッサは、
固定長デコーディングを使用して、第1のサフィックスシンタックス要素をデコードするようにと、
前記第1のプレフィックスシンタックス要素と前記第1のサフィックスシンタックス要素とを逆バイナリ化して、前記最後の有意係数の位置を取得するようにさらに構成されているC16記載の装置。
[C18]
前記現在ブロックに対する変換ブロックが、128サンプル寸法変換ブロックであり、
前記変換ブロックのサイズの関数を使用して、前記最後の有意係数の位置を示す前記シンタックス要素の前記エントロピーコード化データの前記1つ以上のビンのそれぞれに対する前記それぞれのコンテキストを決定するために、前記1つ以上のプロセッサは、
前記128サンプル寸法変換ブロックに対する第1の関数を使用して、前記最後の有意係数の位置を示す前記シンタックス要素の前記エントロピーコード化データの前記1つ以上のビンのそれぞれに対する前記それぞれのコンテキストを決定し、前記第1の関数は、64サンプル寸法変換ブロックに対する最後の有意係数の位置を示すシンタックス要素のエントロピーコード化データの1つ以上のビンのそれぞれに対するそれぞれのコンテキストを決定するのに使用される第2の関数とは異なり、前記第1の関数は、32サンプル寸法変換ブロックに対する最後の有意係数の位置を示すシンタックス要素のエントロピーコード化データの1つ以上のビンのそれぞれに対するそれぞれのコンテキストを決定するのに使用される第3の関数とは異なるようにさらに構成されているC11記載の装置。
[C19]
前記1つ以上のプロセッサは、
前記最後の有意係数の位置に基づいて、前記変換ブロックをデコードして、変換係数を取得するようにと、
前記変換係数に逆変換を適用して、残差ブロックを取得するようにと、
前記現在ブロックに対する予測プロセスを実行して、予測ブロックを取得するようにと、
前記残差ブロックを前記予測ブロックに加算して、ビデオデータのデコードされたブロックを取得するようにさらに構成されているC11記載の装置。
[C20]
前記ビデオデータのデコードされたブロックを含むピクチャーを表示するように構成されているディスプレイをさらに具備するC19記載の装置。
[C21]
前記装置は、ワイヤレス通信デバイスであるC11記載の装置。
[C22]
命令を記憶している非一時的コンピュータ読取可能記憶媒体において、
前記命令は、実行されるときに、ビデオデータをデコードするように構成されているデバイスの1つ以上のプロセッサに、
前記ビデオデータの現在ブロックに対するエントロピーコード化データを受信させ、前記エントロピーコード化データは、前記現在ブロックの変換ブロック中の最後の有意係数の位置を示すシンタックス要素に対するエントロピーコード化データを含み、
前記変換ブロックのサイズの関数を使用させて、前記最後の有意係数の位置を示す前記シンタックス要素の前記エントロピーコード化データの1つ以上のビンのそれぞれに対するそれぞれのコンテキストを決定させ、異なるサイズの変換ブロックに対して同じコンテキストが使用されないように、前記関数は、前記それぞれのコンテキストを出力し、
前記決定されたそれぞれのコンテキストを使用させて、前記最後の有意係数の位置を示す前記シンタックス要素に対する前記エントロピーコード化データをデコードさせる非一時的コンピュータ読取可能記憶媒体。
[C23]
前記現在ブロックに対する変換ブロックが、64サンプル寸法変換ブロックであり、前記関数は、線形演算と非線形演算とを含むC22記載の非一時的コンピュータ読取可能記憶媒体。
[C24]
前記非線形演算が、ビットシフトとクリッピングとを有するサイズ依存オフセットを含むC23記載の非一時的コンピュータ読取可能記憶媒体。
[C25]
前記現在ブロックに対する変換ブロックが、64サンプル寸法変換ブロックであり、
前記変換ブロックのサイズの関数を使用して、前記最後の有意係数の位置を示す前記シンタックス要素の前記エントロピーコード化データの前記1つ以上のビンのそれぞれに対する前記それぞれのコンテキストを決定するために、前記命令は、前記1つ以上のプロセッサに、さらに、
前記64サンプル寸法変換ブロックに対する第1の関数を使用させて、前記最後の有意係数の位置を示す前記シンタックス要素の前記エントロピーコード化データの前記1つ以上のビンのそれぞれに対する前記それぞれのコンテキストを決定させ、前記第1の関数は、32サンプル寸法変換ブロックに対する最後の有意係数の位置を示すシンタックス要素のエントロピーコード化データの1つ以上のビンのそれぞれに対するそれぞれのコンテキストを決定するのに使用される第2の関数とは異なるC22記載の非一時的コンピュータ読取可能記憶媒体。
[C26]
前記変換ブロックのサイズの関数を使用して、前記最後の有意係数の位置を示す前記シンタックス要素の前記エントロピーコード化データの前記1つ以上のビンのそれぞれに対する前記それぞれのコンテキストを決定するために、前記命令は、前記1つ以上のプロセッサに、さらに、
前記変換ブロックのサイズの関数と色成分インデックスとを使用させて、それぞれのコンテキストオフセットとそれぞれのコンテキストシフトとを決定させ、
前記それぞれのビンに対するビンインデックスと、前記それぞれのコンテキストオフセットと、前記それぞれのコンテキストシフトとを使用させて、前記1つ以上のビンのそれぞれのビンに対する前記それぞれのコンテキストを決定させるC22記載の非一時的コンピュータ読取可能記憶媒体。
[C27]
前記シンタックス要素が、前記最後の有意係数の位置のX位置を示す第1のプレフィックスシンタックス要素、または、前記最後の有意係数の位置のY位置を示す第2のプレフィックスシンタックス要素のうちの1つであり、
前記決定されたそれぞれのコンテキストを使用して、前記最後の有意係数の位置を示す前記シンタックス要素に対する前記エントロピーコード化データをデコードするために、前記命令は、前記1つ以上のプロセッサに、さらに、
前記決定されたそれぞれのコンテキストを使用させて、前記第1のプレフィックスシンタックス要素または前記第2のプレフィックスシンタックス要素に対する前記エントロピーコード化データをデコードさせるC22記載の非一時的コンピュータ読取可能記憶媒体。
[C28]
前記命令は、前記1つ以上のプロセッサに、さらに、
固定長デコーディングを使用させて、第1のサフィックスシンタックス要素をデコードさせ、
前記第1のプレフィックスシンタックス要素と前記第1のサフィックスシンタックス要素とを逆バイナリ化させて、前記最後の有意係数の位置を取得させるC27記載の非一時的コンピュータ読取可能記憶媒体。
[C29]
前記現在ブロックに対する変換ブロックが、128サンプル寸法変換ブロックであり、
前記変換ブロックのサイズの関数を使用して、前記最後の有意係数の位置を示す前記シンタックス要素の前記エントロピーコード化データの前記1つ以上のビンのそれぞれに対する前記それぞれのコンテキストを決定するために、前記命令は、前記1つ以上のプロセッサに、さらに、
前記128サンプル寸法変換ブロックに対する第1の関数を使用させて、前記最後の有意係数の位置を示す前記シンタックス要素の前記エントロピーコード化データの前記1つ以上のビンのそれぞれに対する前記それぞれのコンテキストを決定させ、前記第1の関数は、64サンプル寸法変換ブロックに対する最後の有意係数の位置を示すシンタックス要素のエントロピーコード化データの1つ以上のビンのそれぞれに対するそれぞれのコンテキストを決定するのに使用される第2の関数とは異なり、前記第1の関数は、32サンプル寸法変換ブロックに対する最後の有意係数の位置を示すシンタックス要素のエントロピーコード化データの1つ以上のビンのそれぞれに対するそれぞれのコンテキストを決定するのに使用される第3の関数とは異なるC22記載の非一時的コンピュータ読取可能記憶媒体。
[C30]
前記命令は、前記1つ以上のプロセッサに、さらに、
前記最後の有意係数の位置に基づいて、前記変換ブロックをデコードさせて、変換係数を取得させ、
前記変換係数に逆変換を適用させて、残差ブロックを取得させ、
前記現在ブロックに対する予測プロセスを実行させて、予測ブロックを取得させ、
前記残差ブロックを前記予測ブロックに加算させて、ビデオデータのデコードされたブロックを取得させるC22記載の非一時的コンピュータ読取可能記憶媒体。
図1
図2
図3
図4
図5
図6
図7