(19)【発行国】日本国特許庁(JP)
(12)【公報種別】特許公報(B2)
(11)【特許番号】
(24)【登録日】2024-11-25
(45)【発行日】2024-12-03
(54)【発明の名称】ビデオ符号化復号化における定量化および逆定量化設計のための方法及び装置
(51)【国際特許分類】
H04N 19/124 20140101AFI20241126BHJP
H04N 19/157 20140101ALI20241126BHJP
H04N 19/176 20140101ALI20241126BHJP
【FI】
H04N19/124
H04N19/157
H04N19/176
【外国語出願】
(21)【出願番号】P 2023136408
(22)【出願日】2023-08-24
(62)【分割の表示】P 2022518415の分割
【原出願日】2020-09-23
【審査請求日】2023-08-28
(32)【優先日】2019-09-23
(33)【優先権主張国・地域又は機関】US
(73)【特許権者】
【識別番号】521147444
【氏名又は名称】ベイジン ダージャー インターネット インフォメーション テクノロジー カンパニー リミテッド
【氏名又は名称原語表記】BEIJING DAJIA INTERNET INFORMATION TECHNOLOGY CO., LTD.
(74)【代理人】
【識別番号】100147485
【氏名又は名称】杉村 憲司
(74)【代理人】
【識別番号】230118913
【氏名又は名称】杉村 光嗣
(74)【代理人】
【識別番号】100211395
【氏名又は名称】鈴木 裕貴
(72)【発明者】
【氏名】チュウ ホンチェン
(72)【発明者】
【氏名】シュウ シャオユウ
(72)【発明者】
【氏名】ワン シエンリン
(72)【発明者】
【氏名】チェン イーウェン
(72)【発明者】
【氏名】マー ツン-チュアン
(72)【発明者】
【氏名】ユ ビン
【審査官】岩井 健二
(56)【参考文献】
【文献】特表2018-510539(JP,A)
【文献】国際公開第2021/040400(WO,A1)
【文献】国際公開第2021/030667(WO,A1)
【文献】Benjamin Bross, Jianle Chen, and Shan Liu,Video Coding (Draft 6),Joint Video Experts Team (JVET) of ITU-T SG 16 WP 3 and ISO/IEC JTC 1/SC 29/WG 11,JVET-O2001 (version 14),15th Meeting: Gothenburg, SE,2019年07月,pp.198-199,282-285
【文献】Yung-Hsuan Chao, et al.,Non-CE8: Quantization in palette escape mode,Joint Video Experts Team (JVET) of ITU-T SG 16 WP 3 and ISO/IEC JTC 1/SC 29/WG 11,JVET-P0483,16th Meeting: Geneva, CH,2019年10月,pp.1-4
【文献】Hong-Jheng Jhu, et al.,Non-CE8: Quantization unification for palette escape and transform skip,Joint Video Experts Team (JVET) of ITU-T SG 16 WP 3 and ISO/IEC JTC 1/SC 29/WG 11,JVET-P515-v2,16th Meeting: Geneva, CH,2019年10月,pp.1-9
(58)【調査した分野】(Int.Cl.,DB名)
H04N 19/00 - 19/98
(57)【特許請求の範囲】
【請求項1】
第1の符号化ブロックについて定量化パラメータ及び定量化レベルを決定することと、
前記定量化パラメータに基づいてスケールレベル表をルックアップすることにより、スケール値を導出することと、
前記第1の符号化ブロックが変換スキップモードで符号化されたと決定したことに応じて、前記定量化レベル、前記スケール値、および複数のビットシフトに基づいて、パレットモードで符号化された第2の符号化ブロックにおけるエスケープサンプルに対して再構成のサンプルを取得する第1の逆定量化演算を適用することで前記第1の符号化ブロックにおけるサンプルのための残差サンプルを取得することと、
を含み、
前記第1の逆定量化演算におけるパラメータは、
前記第1の符号化ブロックまたは
前記第2の符号化ブロックのブロックサイズ
により決定されていない、
ビデオ符号化のための方法。
【請求項2】
第3の符号化ブロックが通常の変換モードで符号化されたと決定したことに応じて、前記第1の逆定量化演算と異なる第2の逆定量化演算を適用することにより、前記第3の符号化ブロックにおけるサンプルのための残差サンプルを取得することとを更に含み、
前記第2の逆定量化演算におけるパラメータは、
前記第1の符号化ブロックのブロックサイズにより決定される、請求項1に記載の方法。
【請求項3】
前記スケールレベル表は、levelScale[k] = { 40, 45, 51, 57, 64, 72 }であり、ここで、k = 0...5である、請求項1に記載の方法。
【請求項4】
エスケープサンプルが前記第2の符号化ブロックに存在するかどうかを示すエスケープフラグを生成すること、
を更に含む、請求項1に記載の方法。
【請求項5】
前記複数のビットシフトは、QP/6ビットの左シフトおよび6ビットの右シフトを含み、ここで、QPは前記定量化パラメータである、請求項1に記載の方法。
【請求項6】
前記第1の逆定量化演算が次のとおりであり、
【数1】
請求項1に記載の方法。
【請求項7】
1つまたは複数のプロセッサと、
前記1つまたは複数のプロセッサに接続されている非一時的なメモリと、
前記非一時的なメモリに格納されている複数のプログラムと、
を含み、
前記複数のプログラムは、前記1つまたは複数のプロセッサによって実行されると、前記1つまたは複数のプロセッサに、
請求項1~6のいずれか1項に記載の方法を実行させる、コンピューティング装置。
【請求項8】
1つまたは複数のプロセッサを有するコンピューティング装置によって実行される
複数のプログラムを格納している非一時的なコンピュータ読取可能な記憶媒体であって、
前記
複数のプログラムは、前記1つまたは複数のプロセッサによって実行されると、前記1つまたは複数のプロセッサに、
請求項1~6のいずれか1項に記載の方法を実行させる、非一時的なコンピュータ読取可能な記憶媒体。
【請求項9】
プロセッサによって実行されると、前記プロセッサに請求項1~6のいずれか一項に記載の方法を実行させる命令を含む、コンピュータプログラム。
【請求項10】
請求項1~6のいずれか一項に記載の方法によって生成されたビットストリームを送信する方法。
【発明の詳細な説明】
【関連出願の相互参照】
【0001】
本出願は、2019年9月22日に提出された米国仮出願第62/904668号に対する優先権を主張するものであり、この特許出願の開示全体を参照によって本願明細書に援引する。
【技術分野】
【0002】
本願は、全般的にビデオ符号化復号化及び圧縮に関し、特に、限定されないが、ビデオ符号化復号化における定量化および逆定量化設計のための方法及び装置に関する。
【背景技術】
【0003】
多種のビデオ符号化復号化技術は、ビデオデータを圧縮することに使用されることができる。ビデオ符号化復号化は、1つまたは複数のビデオ符号化復号化標準に従って実行される。ビデオ符号化復号化標準には、多用途ビデオ符号化(VVC:Versatile Video Coding)、共同探査試験モデル(JEM:Joint Exploration Test Model)、高効率ビデオ符号化復号化(H.265/HEVC:High Efficiency Video Coding)、高度なビデオ符号化復号化(H.264/AVC:Advanced Video Coding)、及び動画専門家グループ(MPEG:Moving picture Experts Group)符号化復号化などを含む。ビデオ符号化復号化では、一般に、ビデオ画像またはシーケンスに存在する冗長性による予測方法(例えば、インター予測、イントラ予測など)を利用する。ビデオ符号化復号化技術の重要な目標は、ビデオ品質の低下を回避しまたは最小限に抑えながら、ビデオデータをより低いビットレートの形式に圧縮することである。
【発明の概要】
【0004】
本開示は、全般的にビデオ符号化復号化における定量化および逆定量化設計に関する技術の例を述べる。
【0005】
本開示の第1の方面に従い、符号化ユニット(CU)の残差データのための定量化パラメータを決定することと、前記定量化パラメーターをスケール率でスケーリングすることにより、スケール値を導出することと、前記CUに関連する複数の係数を決定することと、前記CUに関連する複数のパラメータを決定することと、前記複数のパラメータをビットシフトすることにより、複数のビットシフトを取得することと、前記スケール値、前記複数の係数、および前記複数のビットシフトに基づいて定量化レベルを取得することと、を含むエンコーダーに適用されるビデオ符号化方法を提供する。
【0006】
本開示の第2の方面に従い、定量化パラメータ及び定量化レベルを含むビデオビットストリームを受信することと、前記定量化パラメータをスケーリング率でスケーリングすることにより、スケール値を導出することと、符号化ユニット(CU)に関連する複数のパラメータを決定することと、前記複数のパラメータをビットシフトすることにより、複数のビットシフトを取得することと、前記定量化レベル、前記スケール値及び前記複数のビットシフトに基づいて、前記CUに関連する複数の係数を取得することと、を含むデコーダに適用されるビデオ符号化方法を提供する。
【0007】
本開示の第3の方面に従い、1つまたは複数のプロセッサと、前記1つまたは複数のプロセッサに接続されている非一時的なメモリと、前記非一時的なメモリに格納されている複数のプログラムと、を含み、前記複数のプログラムは、前記1つまたは複数のプロセッサによって実行されると、前記1つまたは複数のプロセッサに、CUの残差データのための定量化パラメータを決定し、前記定量化パラメーターをスケール率でスケーリングすることにより、スケール値を導出し、前記CUに関連する複数の係数を決定し、前記CUに関連する複数のパラメータを決定し、前記複数のパラメータをビットシフトすることにより、複数のビットシフトを取得し、前記スケール値、前記複数の係数、および前記複数のビットシフトに基づいて定量化レベルを取得する、のような操作を実行させる、コンピューティング装置を提供する。
【0008】
本開示の第4の方面に従い、1つまたは複数のプロセッサと、前記1つまたは複数のプロセッサに接続されている非一時的なメモリと、前記非一時的なメモリに格納されている複数のプログラムと、を含み、前記複数のプログラムは、前記1つまたは複数のプロセッサによって実行されると、前記1つまたは複数のプロセッサに、定量化パラメータ及び定量化レベルを含むビデオビットストリームを受信し、前記定量化パラメータをスケーリング率でスケーリングすることにより、スケール値を導出し、CUに関連する複数のパラメータを決定し、前記複数のパラメータをビットシフトすることにより、複数のビットシフトを取得し、前記定量化レベル、前記スケール値及び前記複数のビットシフトに基づいて、前記CUに関連する複数の係数を取得する、のような操作を実行させる、コンピューティング装置を提供する。
【0009】
本開示の第5の方面に従い、1つまたは複数のプロセッサを有するコンピューティング装置によって実行される複数のプログラムを格納している非一時的なコンピュータ読取可能な記憶媒体であって、前記複数のプログラムは、前記1つまたは複数のプロセッサによって実行されると、前記1つまたは複数のプロセッサに、CUの残差データのための定量化パラメータを決定し、前記定量化パラメーターをスケール率でスケーリングすることにより、スケール値を導出し、前記CUに関連する複数の係数を決定し、前記CUに関連する複数のパラメータを決定し、前記複数のパラメータをビットシフトすることにより、複数のビットシフトを取得し、前記スケール値、前記複数の係数、および前記複数のビットシフトに基づいて定量化レベルを取得する、のような操作を実行させる、非一時的なコンピュータ読取可能な記憶媒体を提供する。
【0010】
本開示の第6の方面に従い、1つまたは複数のプロセッサを有するコンピューティング装置によって実行される複数のプログラムを格納している非一時的なコンピュータ読取可能な記憶媒体であって、前記複数のプログラムは、前記1つまたは複数のプロセッサによって実行されると、前記1つまたは複数のプロセッサに、定量化パラメータ及び定量化レベルを含むビデオビットストリームを受信し、前記定量化パラメータをスケーリング率でスケーリングすることにより、スケール値を導出し、CUに関連する複数のパラメータを決定し、前記複数のパラメータをビットシフトすることにより、複数のビットシフトを取得し、前記定量化レベル、前記スケール値及び前記複数のビットシフトに基づいて、前記CUに関連する複数の係数を取得する、のような操作を実行させる、非一時的なコンピュータ読取可能な記憶媒体を提供する。
【図面の簡単な説明】
【0011】
本開示の例のより具体的な説明は、添付の図面に示す特定の例を参照して与えられる。これらの図面はいくつかの例を示しているに過ぎず、したがって範囲の限定でないと考すれば、これらの例は、添付の図面を使用することにより、追加の特異性および詳細が説明される。
【0012】
【
図1】
図1は、本開示のある実施形態に係る例示的なビデオエンコーダを示すブロック図である。
【
図2】
図2は、本開示のある実施形態に係る例示的なビデオデコーダを示すブロック図である。
【
図3】
図3は、本開示のある実施形態に係る、符号化木ユニット(CTU:Coding Tree Unit)に分割された画像を示す。
【
図4】
図4は、本開示のある実施形態に係る、マルチタイプ木分割モードを示す概略図である。
【
図5】
図5は、本開示のある実施形態に係る、入れ子マルチタイプ木符号化木構造を有する四分木における区画分割情報の信号による通知メカニズムを示す。
【
図6】
図6は、本開示のある実施形態に係る、入れ子マルチタイプ木符号化ブロック構造を有する四分木で複数のCUに分割されたCTUを示す。
【
図7】
図7は、本開示のある実施形態に係る、パレットモッドで符号化復号化されたブロックの例を示す。
【
図8】
図8A及び
図8Bは、本開示のある実施形態に係る、水平及び垂直トラバース走査を示す。
【
図9】
図9は、本開示のある実施形態に係る、パレットインデックスの符号化を示す。
【
図10】
図10は、本開示のある実施形態に係る、ビデオ符号化復号化のための例示的な装置を示すブロック図である。
【
図11】
図11は、本開示のある実施形態に係る、ビデオ符号化復号化における定量化設計の例示的な処理を示すフローチャートである。
【
図12】
図12は、本開示のある実施形態に係る、ビデオ符号化復号化における逆定量化設計の例示的な処理を示すフローチャートである。
【発明を実施するための形態】
【0013】
以下、例が添付の図面に示されている具体的な実施の形態を詳細に参照する。以下の詳細な説明において、ここで述べる趣旨を容易に理解するために、複数の非限定的な具体的な詳細を述べる。ただし、各種の変形を実現することができることは、当業者にとって明らかである。例えば、ここで述べる趣旨がデジタルビデオ機能を有する多くの種類の電子装置で実現され得ることは、業者にとって明らかである。
【0014】
本明細書における「1つの実施形態」、「実施形態」、「例」、「ある実施形態」、「ある例」または類似の表現への言及は、述べる特定の特徴、構造または特性が少なくとも1つの実施形態または例に含まれることを意味する。1つまたは複数の実施形態と結合して述べる特徴、構造、要素または特性は、明確に別段の指示をしない限り、他の実施形態にも適用可能である。
【0015】
本開示全体では、「第1」、「第2」、「第3」などの用語はすべて、関連する要素、例えば、装置、部品、構成、ステップなどへの言及のためのものとしてのみ使用され、文脈が明確に別段の指示をしない限り、任意の空間的または時間的な順を意味するものでない。たとえば、「第1の装置」および「第2の装置」は、2つの別個に形成された装置、または同一の装置における2つの部分、部品、または操作状態を指すものであって、任意に名前が付けられることができる。
【0016】
「モジュール」、「サブモジュール」、「回路」、「サブ回路」、「回路システム」、「サブ回路システム」、「ユニット」または「サブユニット」という用語は、1つまたは複数のプロセッサによって実行できるコードまたは命令を格納するメモリ(共有、専用、またはグループ)を含む。モジュールは、コードまたは命令を格納しているか、または格納していない1つまたは複数の回路が含む場合がある。モジュールまたは回路は、直接または間接的に接続されている1つまたは複数の部品を含むことが可能である。これらの部品は、互いに物理的に接続したり、互いに隣り合って位置したり、またはそうでないことが可能である。
【0017】
ここで使用されるように、「(もし)…たら」または「(もし)…ば」、「(もし)…と」という用語は、文脈に応じて、「…ときに」または「…に応じて」を意味すると理解されることが可能である。これらの用語は、請求の範囲に出現する場合、関連する限定または特徴が条件付き的または選択的であることを意味していない場合がある。たとえば、一つの方法は、i)条件Xが存在する場合、機能または動作X'が実行されるステップと、ii)条件Yが存在する場合、機能または動作Y'が実行されるステップとを含む。この方法は、機能または動作X'を実行する能力と、機能または動作Y'を実行する能力との両方を含めて実現される必要がある。そこで、機能X'とY'とは両方とも、異なる時間にこの方法の複数回の実行で実現されることが可能である。
【0018】
ユニットまたはモジュールは、完全にソフトウェアによって実現されてもよく、完全にハードウェアによって実現されてもよく、またはハードウェアとソフトウェアとの組み合わせによって実現されてもよい。完全的なソフトウェアの実現では、たとえば、ユニットまたはモジュールが、特定の機能を実行するために、直接的または間接的に互いにリンクされている機能的に関連するコードブロックまたはソフトウェア部品を含むことが可能である。
【0019】
図1は、本開示のある実施形態に係る例示的なビデオエンコーダを示すブロック図である。エンコーダ100には、ビデオフレームが、処理のための複数のビデオブロックに区画される。予測は、特定のビデオブロックごとに、インター予測アプローチまたはイントラ予測アプローチに基づいて形成される。インター予測では、以前に再構成されたフレームからの画素に基づいて、動き推定及び動き補償によって1つ又は複数の予測子を形成する。イントラ予測では、現在のフレームにおける再構成された画素に基づいて予測子を形成する。モード決定により、現在のブロックを予測するための最適な予測子が選択されることができる。
【0020】
変換回路102には、現在のビデオブロックとその予測子との差を表す予測残差が送られる。そして、定量化回路104には、エントロピーの低減のために、変換係数が変換回路102から送られる。次に、定量化された係数は、エントロピー符号化回路106に供給されて圧縮されたビデオビットストリームを生成する。
図1に示すように、インター予測回路および/またはイントラ予測回路112からのビデオブロック区画情報、動きベクトル、参照画像インデックス、およびイントラ予測モードなどの予測関連情報110も、エントロピー符号化回路106を介して供給され、圧縮されたビデオビットストリーム114に保存される。
【0021】
当該エンコーダ100では、予測の目的として、画素を再構成するために、デコーダ関連回路も必要である。最初には、逆定量化116および逆変換回路118では、予測残差が再構成される。この再構成された予測残差は、ブロック予測子120と組み合わされて、現在のビデオブロックのためのフィルタリングされていない再構成画素が生成される。
【0022】
符号化効率及び表示品質をさらに向上させるために、インループフィルタを使用する。例えば、AVC、HEVC、およびVVCの現在のバージョンでは、非ブロック化フィルタが提供されている。HEVCでは、符号化効率をさらに向上させるために、SAO(サンプル適応型オフセット)と呼ばれる追加的インループフィルターが定義されている。VVC標準の現在のバージョンでは、更なる別のALF(適応型ループフィルタ)と呼ばれるインループフィルターが積極的に研究されており、最終の標準に含まれている可能性が高い。
【0023】
図2は、多くのビデオ符号化復号化標準と組み合わせて使用できる例示的なブロックに基づくビデオデコーダ200を示すブロック図である。このデコーダ200は、
図1のエンコーダ100における再構成関連部分に類似している。デコーダ200では、入力ビデオビットストリーム201は、最初にエントロピー復号化202により復号化されて、定量化された係数レベルおよび予測関連情報が導出される。次に、定量化された係数レベルは、逆定量化204および逆変換206により処理されて、再構成された予測残差が得られる。イントラ/インターモード選択部212において実現されているブロック予測子メカニズムは、復号化された予測情報に基づいて、イントラ予測208または動き補償210を実行するように構成されている。逆変換206からの再構成された予測残差と、ブロック予測子メカニズムによって生成された予測出力とが、加算部214によって加算されることで、フィルタリングされていない再構成の画素のセットが取得される。インループフィルタ209がオンになる場合では、これらの再構成の画素に対してフィルタリング操作を実行されて、最終的な再構成されたビデオ出力222を導出する。
【0024】
上述した、VVC、JEM、HEVC、MPEG-4、Part10のようなビデオ符号化/復号化標準は、概念的に類似している。たとえば、これらは、すべてブロックに基づく処理を使用する。共同ビデオ専門家チーム(JVET:Joint Video Experts Team)は、JVETの会議において、多用途ビデオ符号化(VVC)の最初のドラフトおよびVVC試験モデル1(VTM1:VVC Test Model 1)符号化方法を定義した。二値および三値分割符号化ブロック構造による入れ子マルチタイプ木を持つ四分木は、VVCの最初の新しい符号化特徴として含まれていることが決定された。四分木では、親ノードが4つの子ノードに分割でき、各子ノードが、4つの新しい子ノードに分割される別の親ノードになる可能性がある。
【0025】
VVCでは、画像区画構造によって、入力ビデオが符号化木ユニット(CTU:coding tree unit)と呼ばれるブロックに分割される。CTUは、入れ子マルチタイプ木構造を持つ四分木によって符号化ユニット(CU)に分割され、ここでリーフCUは、同じ予測モード(例えばイントラまたはインター)を共有する領域を定義している。本開示では、「ユニット」という用語は、すべての成分をカバーする画像の領域を定義している。「ブロック」という用語は、特定の成分(例えば、輝度)をカバーする領域を定義するためのものであって、4:2:0などの彩度サンプリングフォーマットを考える場合、空間的な位置において異なることがある。
画像のCTUへの区画
【0026】
画像は一連の符号化木ユニット(CTU)に分割される。CTUの概念は、HEVCのCTUの概念と同じである。3つのサンプル配列がある画像の場合では、CTUが、N×Nの輝度サンプルブロック及び2つの対応する彩度サンプルブロックからなる。
図3は、本開示のある実施形態に係る、CTUに分割された画像を示す。CTUにおける輝度ブロックの最大許可サイズは128×128に指定されている。輝度変換ブロックの最大サイズは64×64である。
木構造によるCTUの区画化
【0027】
HEVCでは、CTUが、各種なローカル特性に適応するように符号化木として示される四分木構造によってCUに分割される。リーフCUレベルでは、画像間(時間的)予測か画像内(空間的)予測かを使用して画像領域を符号化することが決定される。各リーフCUは、予測ユニット(PU)分割タイプに応じて、さらに1つ、2つ、または4つのPUに分割されることができる。1つのPU内では、同じ予測処理が適用され、関連情報がPU単位でデコーダーに送信される。PU分割タイプに基づいて予測処理を適用することで残差ブロックを取得した後、リーフCUが、このCUのための符号化木と類似な別の四分木構造に従って変換ユニット(TU)に区画されることができる。HEVC構造の主要な特徴の1つは、CU、PU、およびTUを含む複数の区画概念があることである。
【0028】
VVCでは、二値および三値分割セグメンテーション構造による入れ子マルチタイプ木を持つ四分木が、複数の区画ユニットタイプの概念を置き換える。例えば、これは、最大変換長のサイズが大きすぎるCUの場合以外、CU、PU、およびTUの概念の区分を取り除き、CU区画形状のより柔軟性をサポートする。符号化木構造では、CUが正方形または長方形の形状をとることが可能である。CTUは、最初に四分木構造によって区画される。次に、この四分木のリーフノードはマルチタイプ木構造によってさらに区画されることが可能である。
【0029】
図4は、本開示のある実施形態に係る、マルチタイプ木分割モードを示す概略図である。
図4に示すように、マルチタイプ木構造では、垂直二値分割(SPLIT_BT_VER)、水平二値分割(SPLIT_BT_HOR)、垂直三値分割(SPLIT_TT_VER)、および水平三値分割(SPLIT_TT_HOR)の4つの分割タイプがある。マルチタイプ木のリーフノードは、符号化ユニット(CU)と呼ばれ、CUは、最大変換長が大きすぎない限り、このセグメンテーションが、更なる区画せずに予測処理及び変換処理に用いられる。そこで、入れ子マルチタイプ木符号化ブロック構造を持つ四分木では、CU、PU、およびTUが同じブロックサイズを持つことが可能である。例外として、サポートされる最大変換長がCUのカラー成分の幅または高さよりも小さい場合である。
【0030】
図5は、本開示のある実施形態に係る、入れ子マルチタイプ木符号化木構造を持つ四分木における区画分割情報の信号による通知メカニズムを示す。CTUは、4分木のルートとして扱われ、最初に4分木構造によって分割される。次に、4分木の各リーフノードは、許可できるのに十分な大きさである限り、マルチタイプ木構造によってさらに分割される。マルチタイプ木構造では、ノードがさらに分割されているかどうかを示す第1のフラグ(mtt_split_cu_flag)が通知される。ノードがさらに分割されていると、第2のフラグ(mtt_split_cu_vertical_flag)が通知されて分割方向が示され、次に第3のフラグ(mtt_split_cu_binary_flag)が通知されて分割が二値分割か三値分割かが示される。 mtt_split_cu_vertical_flag及びmtt_split_cu_binary_flagの値に基づいて、CUのマルチタイプ木分割モード(MttSplitMode)が表1に示すように導出される。
【表1】
【0031】
図6は、本開示のある実施形態に係る、入れ子マルチタイプ木符号化ブロック構造を持つ四分木で複数のCUに分割されたCTUを示す。
図6に示すように、太いブロックエッジは四分木区画を表し、残りのエッジはマルチタイプ木区画を表す。入れ子マルチタイプ木区画を持つ四分木は、CUからなるコンテンツ適応型の符号化木構造を提供する。CUのサイズは、CTUと同じくらい大きいか、輝度サンプルの単位で4×4と小さいかである。4:2:0彩度フォーマットの場合では、最大彩度符号化ブロック(CB)サイズが64×64であり、最小彩度CBサイズが2×2である。
【0032】
VVCでは、サポートされる最大輝度変換サイズが64×64であり、サポートされる最大彩度変換サイズが32×32である。CBの幅または高さが最大変換幅または最大変換高さよりも大きい場合では、CBが水平方向および/または垂直方向にその方向の変換サイズ制限に適合するように自動的に分割される。
【0033】
以下のパラメーターは、入れ子マルチタイプ木符号化木スキームを持つ四分木のためのシーケンスパラメータセット(SPS:Sequence Parameter Set)構文要素によって定義および指定される。
【0034】
CTUサイズ:四分木のルートノードサイズである;
【0035】
MinQTSize:最小許可四分木リーフノードサイズである;
【0036】
MaxBtSize:最大許可二分木ルートノードサイズである;
【0037】
MaxTtSize:最大許可三分木ルートノードサイズである;
【0038】
MaxMttDepth:マルチタイプ木分割の四分木リーフノードからの最大許可階層深さである。
【0039】
MinBTSize:最小許可二分木リーフノードサイズである;
【0040】
MinTtSize:最小許可三分木リーフノードサイズである。
【0041】
入れ子マルチタイプ木符号化木構造を持つ四分木の一例では、CTUサイズが2つの対応する64×64ブロックの4:2:0彩度サンプルを持つ128×128輝度サンプルに設定されている。MinQTSizeが16×16、MaxBtSizeが128×128、MaxTtSizeが64×64に設定されている。MinBtSize及びMinTtSizeの幅及び高さの両方が4×4、MaxMttDepthが4に設定されている。四分木区画は最初にCTUに適用されて、四分木リーフノードが生成される。四分木リーフノードは、16×16(即ち、MinQTSize)から128×128(即ち、CTUサイズ)までのサイズを持つことが可能である。リーフQTノードが128×128である場合、このサイズがMaxBtSize及びMaxTtSize(即ち、64×64)を超えるため、当該リーフQTノードが二分木によってさらに分割されることがではない。それ以外の場合、当該リーフQTノードはマルチタイプ木によってさらに区画されることができる。したがって、当該四分木リーフノードはマルチタイプ木のルートノードでもあって、マルチタイプ木深さ0、即ちMttDepthを持つものである。このマルチタイプ木深さがMaxMttDepth(即ち、4)に達すると、更なる分割が考慮されない。当該マルチタイプ木ノードがMinBtSizeに等しく、かつ2×MinTtSize以下の幅を持つと、更なる水平分割が考慮されない。同様に、当該マルチタイプ木ノードがMinBtSizeに等しくかつ2×MinTtSize以下の高さを持つと、更なる垂直分割が考慮されない。
【0042】
図7は、本開示のある実施形態に係る、パレットモッドで符号化復号化されたブロックの例を示す。ハードウェアによるVVCデコーダーでは、64×64輝度ブロック及32×32彩度パイプライン設計を可能にするために、
図7に示すように、輝度符号化ブロックの幅または高さが64よりも大きい場合、TT分割が禁止される。彩度符号化ブロックの幅または高さが32よりも大きい場合でも、TT分割が禁止されます。
【0043】
VVCでは、符号化木スキームは、輝度および彩度が別個のブロック木構造を有する能力をサポートする。このCU分割構造は、双木構造または双符号化木構造と呼ばれる。輝度及び彩度の両方で共有されるCU分割構造は、単一木構造または単一符号化木構造と呼ばれる。Pスライス及びBスライスの場合、1つのCTU内の輝度および彩度符号化木ブロック(CTB)は、同じ符号化木構造を共有する必要がある。ただし、Iスライスの場合、輝度及び彩度が別々のブロック木構造を持つことができる。個別のブロック木モードが適用される場合には、輝度CTBが1つの符号化木構造によってCUに分割され、彩度CTBが別の符号化構造によって彩度CUに分割される。これは、IスライスにおけるCUが、1つの輝度成分の符号化ブロックまたは2つの彩度成分の符号化ブロックからなり、PまたはBスライスにおけるCUが、ビデオがモノクロでない限り、常に3つのカラー成分すべての符号化ブロックからなる。
コア変換のマルチ変換選択(MTS)
【0044】
HEVCで使用されたDCT―IIに加えて、MTSスキームが、インター符号化されたブロックおよびイントラ符号化されたブロックの両方の残差符号化に使用される。これは、DCT8/DST7から選択された複数の変換を使用する。新しく導入された変換行列は、DST―VII及びDCT―VIIIである。表2には、選択したDST/DCTの基本関数を示す。
【表2】
【0045】
変換行列の直交性を維持するために、変換行列はHEVCにおける変換行列よりも正確に定量化される。変換された係数の中間値を16ビット範囲内に維持するために、水平変換後及び垂直変換後、すべての係数は10ビットを持つことになる。
【0046】
MTSスキームを制御するために、イントラ及びインターについて個別の有効化フラグがSPSレベルでそれぞれ指定される。MTSがSPSで有効化されると、MTSが適用るかどうかを示すCUレベルフラグが信号で通知される。ここでは、MTSが輝度のみに適用される。MTS CUレベルフラグは、次の条件が満たされたときに通知される。つまり、まず、幅及び高さの両方が32以下であり、次に、CBFフラグが1に等しい。
【0047】
MTS CUフラグが0に等しい場合、DCT2が両方向に適用される。ただし、MTS CUフラグが1に等しい場合、水平方向及び垂直方向の変換タイプをそれぞれ示す他の2つのフラグが追加で通知される。変換及び信号による通知マッピングテーブルが表3に示されている。ISPおよび非明示的MTSに対する統合した変換選択は、イントラモードおよびブロック形状の依存関係を除去することで使用される。現在のブロックがISPモードの場合、または現在のブロックがイントラブロックであり、イントラ及びインター明示的MTSがオンの場合、DST7のみが水平変換コア及び垂直変換コアの両方に使用される。変換行列の精度については、8ビットの一次変換コアが使用される。したがって、HEVCで使用される、4点DCT2およびDST7、8点、16点および32点DCT2を含むすべての変換コアは同じままである。また、64点DCT2、4点DCT8、8点、16点、32点DST7及びDCT8を含む他の変換コアは、8ビットの一次変換コアを使用する。
【表3】
【0048】
大きなサイズのDST7およびDCT8の複雑さを低減するために、高周波変換係数は、サイズ(幅または高さ、または幅と高さの両方)が32に等しいDST7およびDCT8ブロックについてゼロとされる。16x16低周波領域内の係数のみは残留される。
【0049】
ブロックの残差は、HEVCの場合のように、変換スキップモードで符号化されることができる。構文符号化の冗長性を回避するために、CUレベルMTS_CU_flagがゼロに等しくない場合、変換スキップフラグは信号で通知される。変換スキップに対するブロックサイズの制限は、JEM4におけるMTSに対するものと同じであって、ブロックの幅及び高さの両方が32以下の場合に変換スキップがCUに適用できることを示す。なお、現在のCUに対してLFNSTまたはMIPがアクティブ化されている場合には、非明示的MTS変換がDCT2に設定され。また、MTSがインター符号化されたブロックに対して有効になっている場合でも、非明示的MTSを有効にすることができる。
定量化パラメータ制御
【0050】
あるの例では、最大QPが51から63に拡張され、それに応じて初期定量化パラメーター(QP)の信号による通知が変更される場合がある。slice_qp_deltaの非ゼロ値が符号化されると、SliceQpYの初期値がスライスセグメントレイヤーで変更される。具体的には、init_qp_minus26の値を(-26+QpBdOffsetY)から+37の範囲になるように変更できる。変換ブロックのサイズが4の累乗でない場合、変換処理による非明示的スケーリングを補正するために、変換係数は、181/256(または181/128)で乗算するのではなく、QPまたはQP levelScaleテーブルへの変更とともに処理される。変換スキップブロックの場合、QPが4に等しいであると定量化ステップサイズが1になるため、最小許可QPは4として定義される。
【0051】
ある例では、固定ルックアップテーブルを使用して、輝度定量化パラメータQPYを彩度定量化パラメータQPCに変換する。VVCでは、より柔軟な輝度―彩度QPマッピングが使用される。柔軟な区分線形モデルを使用し、線形モデルへの唯一の制約が各区分の傾きが負にならないことであるSPSでは、固定テーブルを使用する代わりに、輝度―彩度QPマッピング関係が信号で通知される。つまり、輝度QPが増加するにつわて、彩度QPは、フラットに留まるか増加しなければならないが、減少することができない。区分線形モデルは、1)モデル内の区分の数;2)その区分のための入力(輝度)および出力(彩度)デルタQPによって定義される。この区分線形モデルの入力範囲は[-QpBdOffsetY, 63]であり、この区分線形モデルの出力範囲は[-QpBdOffsetC, 63]である。QPマッピング関係は、Cb、Cr、およびジョイントCb/Cr符号化に関して個別に信号で通知されることも、3つのタイプの残差符号化すべてに関して併せて信号で通知することもできる。
【0052】
HEVCの場合と同様に、CUレベルQP適応はVVCで許可されている。輝度成分及び彩度成分のデルタQP値は、別々に信号で通知されることができる。彩度成分の場合、許可されている彩度QPオフセット値は、HEVCと同様の方法で、画像パラメータセット(PPS)におけるオフセットリストの形式で通知される。リストは、Cb、Cr、およびジョイントCb/Cr符号化に関して個別に定義されている。Cb、Cr、およびジョイントCb/Crリストのそれぞれについては、最大6つのオフセット値が許可される。CUレベルでは、オフセットリスト内のどのオフセット値がそのCUの彩度QPを調整するように使用されるかを示すインデックスが信号で通知される。
変換係数の定量化および逆定量化処理
【0053】
変換処理では、定量化および逆定量化処理中に結果として得られる係数を特定の因子でスケールしたから、シフト操作を行う必要がある。スケーリング率は次のように定義される。
【数1】
ここで、M及びNは、変換ブロックの幅及び高さである。
【0054】
ある例では、ブロックの次元が2の累乗であって、M=2
mおよびN=2
nである。これは、MがNに等しい場合、または実際にM・Nが4の累乗である場合、スケーリング率が右シフトによって適用できることを意味する。このような条件を満たすブロックは、「通常ブロック」と呼ばれる。M・Nが4の累乗でない場合、異なるスケール及びシフト値が補償に使用される。スケール値は表4のように定義されている。このような条件を満たすブロックは、「補償ブロック」と呼ばれる。
【表4】
【0055】
変換スキップモードで符号化されたブロックについては、通常ブロックに対して定義されたスケールおよびシフト操作が実行される。
【0056】
スケーリングされた変換係数の導出が表5に示されている。表5のすべての変数の定義は、VVC草案仕様のバージョン6に記載されている。
【表5】
【0057】
QP値が使用されていれば、変換係数の定量化および逆定量化処理は次のように記述できる。定量化は、式(2)で表すことができる。
【数2】
【0058】
逆定量化は、式(3)で表すことができる。
【数3】
ここで、変数rectNonTsFlagは、式(4)で取得できる。
【数4】
また、変数transformShift'は、式(5)で取得できる。
ここで、pCoeffは変換係数値である;pLevelは、定量化された値または定量化レベルである;pCoeff’は、非定量化処理から再構成された変換係数値である。
【0059】
変数rectNonTsFlagは、現在のブロックが「通常ブロック」または「補償ブロック」として分類されているかどうかを表す。これはfalseまたは0の値を有する場合、現在のブロックは通常ブロックとして分類されている。これはtrueまたは1の値を有する場合、現在のブロックは補償ブロックとして分類されている。
【0060】
変数transformShiftは、
【数5】
に等しい2次元(2D)変換によるダイナミック範囲の増加を補償するために使用されるビットシフトを表し、ここで、W及びHが現在の変換ユニットの幅及び高さであり、bitDepthが符号化ビット深度である。シフト操作で使用される実際の値transformShift'は、rectNonTsFlagの値に応じて、transformShiftと同じ値、または(transformShift-1)に等しい値を取る場合がある。encScale[][]およびdecScale[][]は、それぞれ14ビットおよび6ビットの精度の定量化および非定量化スケーリング値であって、表4に示すように定義される。「通常ブロック」または「補償ブロック」に使用されるススケーリング率のセットは、rectNonTsFlagの値に応じて、選択されて現在のブロックに使用される。
変換スキップモードのための定量化および非定量化処理
【0061】
変換スキップモードでは、予測残差が、変換操作を実行せずに直接定量化および符号化される。より具体的には、その定量化および非定量化処理は、以下のように説明されることができる。
【0062】
定量化は、式(6)で表すことができる。
【数6】
非定量化は、式(7)で表すことができる。
【数7】
ここで、pResi及びpResi'は、元の予測残差サンプル値と再構成された予測残差サンプル値である;pLevelは、定量化された値又は定量化レベルである;encScale[]及びdecScale[]は、それぞれ14ビット及び6ビットの精度の定量化及び非定量化スケーリング値であって、表4に示す「通常ブロック」に使用されるものと同じように定義される。
パレットモードのための定量化および非定量化処理
【0063】
VTM6は、4:4:4カラーフォーマットでの画面内容符号化のためのパレットモードをサポートしている。パレットモードが有効になっていて、CUのサイズが64×64以下である場合、パレットモードがこのCUに使用されるかどうかが示すフラグがCUレベルで送信される。パレットモードは、イントラ予測、インター予測、およびイントラブロックコピー(IBC)モード以外の予測モードとして信号で通知される。
【0064】
パレットモードがCUに使用される場合、CUにおけるサンプル値は、代表的な色値の小さなセットで表すことができる。このセットは「パレット」と呼ばれる。パレット色に近い値を持つ画素については、パレットインデックスが、それらの値をデコーダーに伝達するように信号で通知される場合がある。
エスケープシンボルインデックスに続いて
エスケープ値を信号で通知することにより、値が如何なるパレット色に近くないサンプルを指定することも可能である。この
エスケープ値は、サンプルの定量化された成分値である。これは
図7に示されている。
【0065】
エスケープ値の定量化及び非定量化については、次の式が、それぞれエンコーダー及びデコーダーで適用される対応する処理を示している。
【0066】
【0067】
非定量化は、式(9)で表すことができる。
【数9】
ここで、pEsca及びpEsca'は、元の
エスケープ値と再構成された
エスケープ値である;pLevelは、定量化された値又は定量化レベルである;encScale[]及びdecScale[]は、それぞれ14ビット及び6ビットの精度の定量化及び非定量化スケーリング値であって、表4に示す「通常ブロック」に使用されるものと同じように定義される。
【0068】
パレットの符号化では、色のリストを含むパレット予測子が維持される。この予測子は、非波面の場合に各スライスの先頭で、波面の場合に各CTU行の先頭で、0(つまり空のリスト)に初期化される。パレット予測子のエントリごとに、再利用フラグが通知されて、このCUの現在のパレットの一部であるかどうかが示される。この再利用フラグは、ゼロのラン長符号化により送信される。この後、新しいパレットエントリの数及び新しいパレットエントリの成分値が信号で通知される。パレットモードでCUを符号化した後、パレット予測子は現在のパレットで更新され、現在のパレットで再利用されないパレット予測子からのエントリが、新しいパレット予測子を形成するように許可された最大パレットサイズに達するまで最後に追加される。現在のCUにおいてエスケープシンボルが存在するかどうかを示すために、各CUに対して1つのエスケープフラグが通知される。エスケープシンボルが存在する場合、パレットテーブルが1つで拡張され、最後のインデックスがエスケープシンボルを表すように割り当てられる。
【0069】
図8A及び
図8Bは、本開示のある実施形態に係る、水平及び垂直トラバース走査を示す。CU内のサンプルのパレットインデックスは、パレットインデックスマップを形成する。インデックスマップは、
図8A及び
図8Bに示されるように、水平および/または垂直トラバース走査により符号化される。走査順序は、palette_transpose_flagによりビットストリームに明示的に信号で通知される。
【0070】
図9は、本開示のある実施形態に係る、パレットインデックスの符号化を示す。パレットインデックスは、INDEX及びCOPY_ABOVEの2つの主要なパレットサンプルモードにより符号化される。このモードは、水平走査のみが使用される第1の行、垂直走査のみが使用される第1の列、または前のモードがCOPY_ABOVEであったパレットサンプル位置を除いて、1つのフラグにより信号で通知される。COPY_ABOVEモードでは、上方の行におけるサンプルのパレットインデックスがコピーされる。INDEXモードでは、パレットインデックスが明示的に信号で通知される。INDEXモード及びCOPY_ABOVEモードの両方では、同じ対応モードにより符号化される画素数を指定するラン値が信号で通知される。
【0071】
インデックスマップの符号化順序は次のとおりである。まず、INDEXランに関連付けられたインデックス値の数が信号で通知される。これに続いて、CU全体の実際のインデックス値が切り捨てられた二値符号化により信号で通知される。次に、パレットモード(INDEXまたはCOPY_ABOVE)及び各ランのラン長がインターリーブ方式で信号で通知される。最後に、CU全体の定量化されたエスケープモード色がグループ化され、指数ゴロンブ符号化で符号化される。
【0072】
双輝度/彩度木を持つスライスの場合、パレットは輝度(Y成分)及び彩度(CbおよびCr成分)に個別に適用される。単一木のスライスの場合、パレットはY、Cb、Cr成分に一緒に適用され、つまり、このパレットにおける各エントリにはY、Cb、Cr値が含まれる。非ブロック化の場合、パレットで符号化されたブロックのブロック境界は非ブロック化されない。
【0073】
定量化スキームの3つの異なる設計が利用可能であり、通常の変換、変換スキップ、およびパレットモードにそれぞれ適用される。それぞれの異なる定量化設計は、異なるシフトおよびスケール操作に関連付けられる。通常の変換が適用されるブロックの場合、シフト及びスケール操作はブロック形状に依存する。変換スキップが適用されるブロックの場合、シフトおよびスケール操作はブロック形状に依存しない。パレットモードで符号化されたブロックの場合、スケール操作のみが実行され、この操作がブロック形状に依存しない。このような非統一の設計は、規格化の観点から最適ではない場合がある。
【0074】
ある例では、変換及び定量化を単純化し、さらに改善するための方法を提供する。変換スキップモードで使用される定量化および逆定量化演算をパレットモードに適用することにで、変換スキップモードおよびパレットモードで使用される定量化および逆定量化演算を統合することが可能である。
【0075】
ある例では、パレットモードでの現在の定量化および逆定量化演算を変換スキップモードに適用することで、変換スキップモードおよびパレットモードで使用される定量化および逆定量化演算を統合することが可能である。
【0076】
ある例では、通常の変換モードのための定量化および逆定量化演算を変換スキップモード及びパレットモードも含むすべてのモードに適用することで、通常の変換モード、変換スキップモード、およびパレットモードの定量化および逆定量化演算をすべて統合することが可能である。
変換スキップモード及びパレットモードのための定量化及び逆定量化の協調
【0077】
【0078】
【0079】
【0080】
【0081】
【0082】
通常の変換モード、変換スキップモード及びパレットモードのための定量化及び逆定量化の協調
【0083】
ある例では、通常の変換モードのための定量化および逆定量化演算を変換スキップモード及びパレットモードを含むすべてのモードに適用することで、通常の変換モード、変換スキップモード、およびパレットモードの定量化および逆定量化演算をすべて統合することが可能である。
【0084】
ある例では、通常の変換モードのための定量化および逆定量化処理が、変換スキップモードおよびパレットモードにも使用される。例えば、式(2)、(3)、(4)、および(5)は、変換スキップモードおよびパレットモードでの定量化/逆定量化処理にも使用される。
【0085】
【0086】
【0087】
【0088】
【0089】
【0090】
【0091】
ある例では、上記の方法を使用して異なるサンプル値の定量化および逆定量化処理を統合する場合、特定の画像領域、たとえば、 CUがロスレス符号化モードで符号化されたことを示すように個別のフラグ、たとえば、trans_quant_bypass_flagをビットストリームに信号で通知することが可能である。 そのようなフラグが、特定のブロックがロスレスモードで符号化されたことを示している場合、対応する定量化および逆定量化処理は、ブロックの符号化に対してバイパスされる。
【0092】
図10は、本開示のある実施形態に係る、ビデオ符号化復号化のための装置を示すブロック図である。装置1100は、携帯電話、タブレットコンピュータ、デジタル放送端末、タブレット装置、または携帯情報端末などの端末であってもよい。
【0093】
装置1100は、
図10に示されるように、処理部1002、メモリ1004、電源部1006、マルチメディア部1008、オーディオ部1010、入力/出力(I/O)インターフェース1012、センサ部1014、および通信部1016のうちの1つ以上を含んでもよい。
【0094】
処理部1002は、通常に、表示、電話発呼、データ通信、カメラ操作、および記録操作に関連する操作など、装置1000の全体的な操作を制御する。処理部1002は、上記の方法のステップの全部または一部を実現するための命令を実行するための1つまたは複数のプロセッサ1020を含むことが可能である。さらに、処理部1002は、処理部1002と他の部品との間の相互作用に寄与する1つまたは複数のモジュールを含むことが可能である。例えば、処理部1002は、マルチメディア部1008と処理部1002との間の相互作用に寄与するためのマルチメディアモジュールを含んでもよい。
【0095】
メモリ1004は、装置1100の動作をサポートするために異なるタイプのデータを格納するように構成される。そのようなデータの例には、装置1100上で動作する任意のアプリケーションまたは方法のための命令、連絡先データ、電話帳データ、メッセージ、画像、ビデオなどが含まれる。メモリ1004は、任意のタイプの揮発性または非揮発性の記憶装置またはそれらの組み合わせによって実現され、メモリ1004は、静的ランダムアクセスメモリ(SRAM:Static Random Access Memory)、電気的に消去可能なプログラマブルリードオンリーメモリ(EEPROM:Electrically Erasable Programmable Read-Only Memory)、消去型プログラマブルリードオンリメモリ(EPROM:Erasable Programmable Read-Only Memory)、プログラマブルリードオンリメモリ(PROM:Programmable Read-Only Memory)、リードオンリメモリ(ROM:Read-Only Memory)、磁気メモリ、フラッシュメモリ、磁気ディスク、またはコンパクトディスクであってもよい。
【0096】
電源部1006は、装置1000の各部品に電力を供給する。電源部1006は、電源管理システム、1つまたは複数の電源、および装置1000のための電力を生成、管理、および分配することに関連する他の部品を含んでもよい。
【0097】
マルチメディア部1008は、装置1000とユーザとの間の出力インターフェースを提供するスクリーンを含む。ある例では、スクリーンには、液晶表示装置(LCD:Liquid Crystal Display)およびタッチパネル(TP:Touch Panel)を含んでもよい。スクリーンがタッチパネルを含む場合、スクリーンは、ユーザからの入力信号を受信するタッチスクリーンとして実現してもよい。このタッチパネルは、このタッチパネル上のタッチ、スライド、およびジェスチャを感知するための1つまたは複数のタッチセンサーを含んでもよい。タッチセンサーは、タッチまたはスライド動作の境界を感知するだけでなく、タッチまたはスライド操作に関連する持続時間および圧力も検出することができる。ある例では、マルチメディア部1008は、フロントカメラおよび/またはリアカメラを含んでもよい。装置1000が撮像モードまたはビデオモードなどの動作モードにあるとき、フロントカメラおよび/またはリアカメラは、外部マルチメディアデータを受信することができる。
【0098】
オーディオ部1010は、オーディオ信号を出力および/または入力するように構成される。例えば、オーディオ部1010は、マイクロフォン(MIC)を含む。マイクロフォンは、装置1000が通話モード、録音モード、および音声認識モードなどの動作モードにあるとき、外部オーディオ信号を受信するように構成される。受信されたオーディオ信号は、メモリ1004にさらに格納されてよく、または通信部1016を介して送信されてもよい。ある例では、オーディオ部1010が、オーディオ信号を出力するためのスピーカーをさらに含む。
【0099】
I/Oインターフェース1012は、処理部1002と周辺インターフェースモジュールとの間のインターフェースを提供する。上述した周辺インターフェースモジュールは、キーボード、クリックホイール、ボタンなどであってもよい。これらのボタンには、ホームボタン、音量ボタン、スタートボタン、およびロックボタンが含まれるが、これらに限定されない。
【0100】
センサ部1014は、装置1000の異なる態様で状態評価を提供するための1つまたは複数のセンサを含む。例えば、センサ部1014は、装置1000のオン/オフ状態および構成要素の相対位置を検出することができる。例えば、これらの構成要素は、装置1000のディスプレイおよびキーパッドである。センサ部1014はまた、装置1000または装置1000の構成要素の位置変化、ユーザによる装置1000上での接触の有無、装置1000の向きまたは加速/減速、および装置1000の温度変化を検出することもできる。センサ部1014は、物理的な接触なしに近くの物体の存在を検出するように構成される近接センサを含んでもよい。センサ部1014は、画像化アプリケーションで使用されるCMOSまたはCCD画像センサなどの光学センサをさらに含んでもよい。ある例では、センサー部1014は、加速度センサー、ジャイロセンサー、磁気センサー、圧力センサー、または温度センサーをさらに含んでもよい。
【0101】
通信部1016は、装置1000と他の装置との間の有線または無線通信に役立つように構成される。装置1000は、WiFi、4G、またはそれらの組み合わせなどの通信標準に基づいて無線ネットワークにアクセスすることができる。一例では、通信部1016は、報知チャネルを介して外部報知管理システムから報知信号または報知関連情報を受信する。一例では、通信部1016は、短距離通信を促進するための近距離無線通信(NFC)モジュールをさらに含んでもよい。例えば、NFCモジュールは、無線周波数識別(RFID)技術、赤外線データ関連付け(IrDA)技術、超広帯域(UWB)技術、ブルートゥース(BT)技術および他の技術に基づいて実現してもよい。
【0102】
一例では、装置1000は、上記の方法を実行するために特定用途向け集積回路(ASIC)、デジタル信号プロセッサ(DSP)、デジタル信号処理装置(DSPD)、プログラマブル論理装置(PLD)、フィールドプログラマブルゲートアレイ(FPGA)、コントローラー、マイクロコントローラー、マイクロプロセッサー、またはその他の電子要素の1つまたは複数によって実現してもよい。
【0103】
非一時的なコンピュータ読取可能な記憶媒体は、例えば、ハードディスクドライブ(HDD)、固体ドライブ(SSD)、フラッシュメモリ、ハイブリッドドライブや固体ハイブリッドドライブ(SSHD)、読み出し専用メモリ(ROM)、コンパクトディスク読み出し専用メモリ(CD―ROM)、磁気テープ、フロッピーディスクなどであってもよい。
【0104】
図11は、本開示のある実施形態に係る、ビデオ符号化復号化における定量化設計の例示的な処理を示すフローチャートである。この処理は、エンコーダーで適用できる。
【0105】
ステップ1101において、プロセッサ1020は、CUの残差データのための定量化パラメータを決定する。
【0106】
ステップ1102において、プロセッサ1020は、定量化パラメータをスケーリング率でスケーリングすることによりスケール値を導出する。
【0107】
ステップ1103において、プロセッサ1020は、CUに関連する複数の係数を決定する。
【0108】
ある例では、これらの複数の係数は、変換係数、CUのエスケープ色値、および予測残差サンプル値を含んでよい。
【0109】
ステップ1104において、プロセッサ1020は、CUに関連する複数のパラメータを決定する。
【0110】
ある例では、これらの複数のパラメータは、符号化ビット深度、およびCUの幅および高さに基づいて決定されるビットシフトを含み、スケーリング率は、CUの幅および高さに基づいて決定される。
【0111】
ステップ1105において、プロセッサ1020は、これらの複数のパラメータをビットシフトすることによって、複数のビットシフトを取得する。
【0112】
ステップ1106において、プロセッサ1020は、スケール値、それらの複数の係数、およびそれらの複数のビットシフトに基づいて定量化レベルを取得する。
【0113】
ある例では、プロセッサ1020は、CUに関連する複数の係数を決定するとき、さらに、CUのエスケープ色値を決定する。エスケープ色値は、このCUから選択された所定の複数の色ではない色を有するCUにおける画素の値であってもよい。そして、プロセッサ1020は、スケール値、これらの複数の係数、およびこれらの複数のビットシフトに基づいて定量化レベルを取得するとき、さらに、スケール値、エスケープ色値、およびこれらの複数のビットシフトに基づいて定量化レベルを取得する。
【0114】
ある例では、プロセッサ1020は、CUに関連する予測残差サンプルをさらに決定する。プロセッサ1020は、CUに関連する複数の係数を決定すると、さらに、予測残差サンプルに対応する予測残差サンプル値を決定する。プロセッサ1020は、スケール値、複数の係数、および複数のビットシフトに基づいて定量化レベルを取得し、さらに、スケール値、予測残差サンプル値、および複数のビットシフトに基づいて定量化レベルを取得する。
【0115】
図12は、本開示のある実施形態に係る、ビデオ符号化復号化における逆定量化設計の例示的な処理を示すフローチャートである。この処理は、デコーダで適用できる。
【0116】
ステップ1201において、プロセッサ1020は、定量化パラメータ及び定量化レベルを含むビデオビットストリームを受信する。
【0117】
ステップ1202において、プロセッサ1020は、定量化パラメータをスケーリング率でスケーリングすることによりスケール値を導出する。
【0118】
ステップ1203において、プロセッサ1020は、CUに関連する複数のパラメータを決定する。
【0119】
ある例では、これらの複数のパラメータは、符号化ビット深度、およびCUの幅および高さに基づいて決定されるビットシフトを含み、スケーリング率は、CUの幅および高さに基づいて決定される。
【0120】
ステップ1204において、プロセッサ1020は、これらの複数のパラメータをビットシフトすることによって、複数のビットシフトを取得する。
【0121】
ステップ1205において、プロセッサ1020は、定量化レベル、スケール値及びこれらの複数のビットシフトに基づいて、CUに関連する複数の係数を取得する。
【0122】
ある例では、これらの複数の係数は、再構成された変換係数、CUの再構成されたエスケープ色値、および再構成された予測残差サンプル値を含んでよい。
【0123】
ある例では、プロセッサ1020は、定量化レベル、スケール値及びこれらの複数のビットシフトに基づいてCUに関連する複数の係数を取得するときに、さらに、定量化レベル、スケール値及びこれらの複数のビットシフトに基づいてCUの再構成されたエスケープ色値を決定する。この再構成されたエスケープ色値は、このCUから選択された所定の複数の色ではない色を有するCUにおける画素の値であってもよい。
【0124】
ある例では、プロセッサ1020は、CUに関連する予測残差サンプルをさらに決定する。プロセッサ1020は、定量化レベル、スケール値、および複数のビットシフトに基づいてCUに関連する複数の係数を取得するとき、定量化レベル、スケール値、およびこれらの複数のビットシフトに基づいて、このCUの再構成された予測残差サンプル値を取得する。この再構成された予測残差サンプル値は、予測残差サンプルに対応することが可能である。
【0125】
ある例では、ビデオ符号化のための計算装置が提供されている。この装置は、プロセッサ1020と、プロセッサによって実行可能な命令を格納するように構成されたメモリ1004とを含む。ここで、プロセッサは、命令の実行時に、
図11に示されるような方法を実行するように構成される。
【0126】
ある例では、ビデオ符号化のための計算装置が提供されている。この装置は、プロセッサ1020と、プロセッサによって実行可能な命令を格納するように構成されたメモリ1004とを含む。ここで、プロセッサは、命令の実行時に、
図12に示されるような方法を実行するように構成される。
【0127】
別のある例では、命令が格納された、非一時的なコンピュータ読取可能な記憶媒体1004が提供される。これらの命令は、プロセッサ1020によって実行されると、このプロセッサに、
図11に示すような方法を実行させる。
【0128】
別のある例では、命令が格納された、非一時的なコンピュータ読取可能な記憶媒体1004が提供される。これらの命令は、プロセッサ1020によって実行されると、このプロセッサに、
図12に示すような方法を実行させる。
【0129】
本開示の説明は、例示の便利のために提示されており、網羅的なまたは本開示に限定されることを意図するものではない。たくさんの変更、変形、および置換した実現は、前述の説明および関連する図面に提示された教示を得った当業者にとっては明らかである。
【0130】
実施形態は、本開示の原理を説明し、当業者が各種の実施のための開示を理解し、基礎原理および各種の変更を予期される特定の用途に適させるための各種の実施を最もよく利用できるようにするために選択されおよび説明されたものである。したがって、本開示の範囲は、開示された実施形態の特定の例に限定されなく、変更および他の実現も、本開示の範囲に含まれることを理解されるべきである。