(19)【発行国】日本国特許庁(JP)
(12)【公報種別】特許公報(B2)
(11)【特許番号】
(24)【登録日】2024-11-25
(45)【発行日】2024-12-03
(54)【発明の名称】ビデオ復号化の方法、装置、及びプログラム、並びにビデオ符号化の方法
(51)【国際特許分類】
H04N 19/70 20140101AFI20241126BHJP
H04N 19/91 20140101ALI20241126BHJP
【FI】
H04N19/70
H04N19/91
(21)【出願番号】P 2023534916
(86)(22)【出願日】2022-04-29
(86)【国際出願番号】 US2022072018
(87)【国際公開番号】W WO2023056108
(87)【国際公開日】2023-04-06
【審査請求日】2023-06-08
(32)【優先日】2021-09-29
(33)【優先権主張国・地域又は機関】US
(32)【優先日】2022-03-31
(33)【優先権主張国・地域又は機関】US
(73)【特許権者】
【識別番号】520353802
【氏名又は名称】テンセント・アメリカ・エルエルシー
(74)【代理人】
【識別番号】100107766
【氏名又は名称】伊東 忠重
(74)【代理人】
【識別番号】100070150
【氏名又は名称】伊東 忠彦
(74)【代理人】
【識別番号】100135079
【氏名又は名称】宮崎 修
(72)【発明者】
【氏名】チョイ,ビヨンドゥ
(72)【発明者】
【氏名】リウ,シャン
(72)【発明者】
【氏名】ウェンジャー,ステファン
【審査官】岩井 健二
(56)【参考文献】
【文献】特開2023-006203(JP,A)
【文献】国際公開第2022/251545(WO,A1)
【文献】Hong-Jheng Jhu, et al.,CE-2.1: Slice based Rice parameter selection for transform skip residual coding,Joint Video Experts Team (JVET) of ITU-T SG 16 WP 3 and ISO/IEC JTC 1/SC 29,JVET-V0054-r1,22nd Meeting, by teleconference,2021年04月,pp.1-6
【文献】Hong-Jheng Jhu, et al.,AHG8: On signalling of sps_ts_residual_coding_rice_present_in_sh_flag,Joint Video Experts Team (JVET) of ITU-T SG 16 WP 3 and ISO/IEC JTC 1/SC 29,JVET-W0121,23rd Meeting, by teleconference,2021年07月,pp.1-2
【文献】Byeongdoo Choi, Stephan Wenger, and Shan Liu,AHG8: General Constraints Information (GCI) flags for operation range extensions,Joint Video Experts Team (JVET) of ITU-T SG 16 WP 3 and ISO/IEC JTC 1/SC 29,JVET-X0095-v2,24th Meeting, by teleconference,2021年10月,pp.1-2
(58)【調査した分野】(Int.Cl.,DB名)
H04N 19/00 - 19/98
(57)【特許請求の範囲】
【請求項1】
デコーダが実行するビデオ復号化の方法であって、
ビデオビットストリームを取得するステップと、
前記ビデオビットストリームに、前記デコーダのための出力レイヤセット内のピクチャのコーディング制御のための一般制約情報(GCI)シンタックス構造に対応する第1シンタックス要素が含まれることを決定するステップであり、前記第1シンタックス要素が、前記GCIシンタックス構造内の追加ビットの数を示す、前記決定するステップと、
前記第1シンタックス要素により少なくとも1つの追加ビットがあることが示される場合に、前記GCIシンタックス構造から、前記ビデオビットストリーム内のコーディングされたビデオデータの第1範囲でのコーディング制御のための第
2シンタックス要素を
復号するステップであって、前記第
2シンタックス要素は、変換スキップモードでの残差コーディングのためのスライスベースRiceコーディングのコーディングツールに関連し、前記コーディングツールは、前記変換スキップモードでの前記残差コーディングのためのスライスレベルでのRiceパラメータを提供する、前記
復号するステップと、
前記第
2シンタックス要素が前記第1範囲での前記コーディングツールの無効化を示す第1値である
場合に、前記コーディングツールを呼び出さずに、コーディングされたビデオデータの1つ以上の第2範囲を含むコーディングされたビデオデータの前記第1範囲を復号するステップと
を有する方法。
【請求項2】
前記第
2シンタックス要素は、
前記GCIシンタックス構造においてgeneral_no_ts_residual_coding_rice_present_in_sh_constraint_flagによって表される、
請求項1に記載の方法。
【請求項3】
前記第
2シンタックス要素の前記第1値は、前記出力レイヤセット内の各コーディングレイヤビデオシーケンス(CLVS)で前記コーディングツールを無効化することを示す、
請求項2に記載の方法。
【請求項4】
前記第
2シンタックス要素が前記第1値である
場合に、前記
ビデオビットストリーム内のコーディングレイヤビデオシーケンス(CLVS)のコーディング制御のための第
3シンタックス要素を、当該CLVSを復号するために前記コーディングツールを呼び出さないことを示す値を有するように制約するステップを更に有する、
請求項2に記載の方法。
【請求項5】
前記第
3シンタックス要素の前記値は、前記CLVSのピクチャ内のスライスのスライスヘッダでの前記コーディングツールに関連したスライスヘッダフラグの不存在を示す、
請求項4に記載の方法。
【請求項6】
前記第
2シンタックス要素が第2値であり、前記変換スキップモードがコーディングレイヤビデオシーケンス(CLVS)で有効にされる
場合に、前記CLVSが参照するシーケンスパラメータセット(SPS)内の第
3シンタックス要素の値を決定するステップを更に有し、
前記第
3シンタックス要素は、Riceパラメータの選択を示すスライスレベルシンタックス要素の存在/不存在を示す、
請求項2に記載の方法。
【請求項7】
前記第
3シンタックス要素の前記値が前記スライスレベルシンタックス要素の存在を示す
場合に、スライスのスライスヘッダから第
4シンタックス要素を復号するステップを更に有し、
前記第
4シンタックス要素は、前記変換スキップモードでの前記スライスの前記残差コーディングのためのRiceパラメータの選択を示す、
請求項6に記載の方法。
【請求項8】
前記第
3シンタックス要素の前記値を決定するステップは、
前記第
3シンタックス要素が前記CLVSの前記SPSに存在しない
場合に、前記CLVSでの前記コーディングツールの不使用を示す前記第3シンタックス要素の前記値を推測するステップを更に有する、
請求項6に記載の方法。
【請求項9】
ビデオ復号化のための装置であって、
プログラムコードを記憶するよう構成される少なくとも1つのメモリと、
前記プログラムコードを読み出し、該プログラムコードによって指示されるように動作するよう構成される少なくとも1つのプロセッサと
を有し、
前記プログラムコードは、前記少なくとも1つのプロセッサによって実行される場合に、前記少なくとも1つのプロセッサに、請求項1乃至
8のうちいずれか一項に記載の方法を実行させる、装置。
【請求項10】
少なくとも1つのプロセッサによって実行される場合に、該少なくとも1つのプロセッサに、請求項1乃至
8のうちいずれか一項に記載の方法を実行させるプログラム。
【請求項11】
エンコーダが実行するビデオ符号化の方法であって、
変換スキップモードでの残差コーディングのためのスライスベースRiceコーディングのコーディングツールが、
ビデオビットストリーム内のコーディングされたビデオデータの第1範囲の符号化中に使用されるかどうかを決定するステップであって、前記コーディングされたビデオデータの前記第1範囲は、前記コーディングされたビデオデータの1つ以上の第2範囲を含み、前記コーディングツールは、前記変換スキップモードでの前記残差コーディングのためのスライスレベルでのRiceパラメータを提供する、前記決定するステップ
を有し、
前記コーディングツールが前記コーディングされたビデオデータの前記第1範囲で使用されない場合に、
デコーダのための出力レイヤセット内のピクチャのコーディング制御のための一般制約情報(GCI)シンタックス構造に対応する第1シンタックス要素を、前記GCIシンタックス構造内に少なくとも1つの追加ビットがあることを示すようセットしてビデオビットストリームに符号化するステップと、
第1値を有する第
2シンタックス要素を
前記GCIシンタックス構造に含めて前記ビデオビットストリームにおいて符号化するステップであって、前記第
2シンタックス要素は、前記
ビデオビットストリーム内の前記コーディングされたビデオデータの第1範囲でのコーディング制御のためのものであり、前記第
2シンタックス要素は、前記変換スキップモードでの前記残差コーディングのための前記スライスベースRiceコーディングの前記コーディングツールに関連し、前記第1値は、前記コーディングされたビデオデータの前記第1範囲のコーディングでの前記コーディングツールの不使用を示す、前記符号化するステップと
を
更に有する方法。
【発明の詳細な説明】
【技術分野】
【0001】
[参照による援用]
本特許出願は、2021年9月29日付けで「TECHNIQUES FOR CONSTRAINT FLAG SIGNALING FOR RANGE EXTENSION WITH TRANSFORM RESIDUAL RICE CODING」との発明の名称で出願された米国特許仮出願第63/250180号に対する優先権の利益を主張して2022年5月31日付けで「TECHNIQUES FOR CONSTRAINT FLAG SIGNALING FOR RANGE EXTENSION WITH RICE CODING」との発明の名称で出願された米国特許出願第17/710794号の優先権の利益を主張するものである。先願の開示は、それらの全文を参照により本願に援用される。
【0002】
[技術分野]
本開示は、ビデオコーディングに概して関係がある実施形態について記載する。
【背景技術】
【0003】
本明細書で与えられている背景の説明は、開示の背景を一般的に提示することを目的とするものである。現在指名されている発明者の研究は、その研究がこの背景の項で説明されている範囲で、また、出願時に先行技術としてさもなければ適格でない可能性がある説明の側面は、本開示に対する先行技術として明示的にも暗黙的にも認められない。
【0004】
ビデオ符号化及び復号化は、動き補償を伴ったインターピクチャ予測を用いて実行することができる。圧縮されていないデジタルビデオはピクチャの連続を含むことができ、各ピクチャは、例えば、1920×1080のルミナンスサンプル及び関連するクロミナンスサンプルの空間ディメンションを有する。ピクチャの連続は、例えば、毎秒60ピクチャ、つまり60Hzの固定又は可変のピクチャレート(俗にフレームレートとしても知られている。)を有することができる。圧縮されていないビデオは、特定のビットレート要件を有している。例えば、サンプル当たり8ビットでの1080p60 4:2:0ビデオ(60Hzのフレームレートでの1920×1080のルミナンスサンプル解像度)は、1.5Gビット/sに近いバンド幅を必要とする。そのようなビデオの1時間は、600Gバイト超の記憶空間を必要とする。
【0005】
ビデオ符号化及び復号化の1つの目的は、圧縮による入力ビデオ信号の冗長性の低減であることができる。圧縮は、いくつかの場合に2桁以上、上記のバンド幅及び/又は記憶空間要件を減らすのを助けることができる。可逆圧縮及び不可逆圧縮の両方並びにそれらの組み合わせが用いられ得る。可逆圧縮は、原信号の厳密なコピーが圧縮された原信号から再構成可能である技術を指す。不可逆圧縮を使用する場合に、再構成された信号は、原信号と同じでない場合があるが、原信号と再構成された信号との間のひずみは、再構成された信号を、意図された用途にとって有用なものとするほど十分に小さい。ビデオの場合には、不可逆圧縮が広く用いられている。許容されるひずみの量は用途に依存し、例えば、特定の消費者ストリーミング用途のユーザは、テレビジョン配信用途のユーザよりも高いひずみを許容し得る。達成可能な圧縮比は、より高い許容可能な/受け入れ可能なひずみがより高い圧縮比をもたらし得ることを反映することができる。
【0006】
ビデオエンコーダ及びデコーダは、例えば、動き補償、変換、量子化、及びエントロピコーディングを含むいくつかの広いカテゴリからの技術を利用することができる。
【0007】
ビデオコーデック技術には、イントラコーディングとして知られている技術が含まれ得る。イントラコーディングでは、サンプル値が、以前に再構成された参照ピクチャからのサンプル又は他のデータを参照せずに表現される。いくつかのビデオコーデックにおいて、ピクチャは、サンプルのブロックに空間的に細分される。サンプルの全ブロックがイントラモードでコーディングされる場合に、そのピクチャはイントラピクチャであることができる。イントラピクチャ及びそれらの派生物、例えば、独立デコーダリフレッシュピクチャ(independent decoder refresh pictures)は、デコーダの状態をリセットするために使用可能であり、従って、コーディングされたビットストリーム及びビデオセッションにおける最初のピクチャとして、又は静止画像として使用され得る。イントラブロックのサンプルは、変換を受けることができ、変換係数は、エントロピコーディング前に量子化され得る。イントラ予測は、変換前領域でサンプル値を最小限にする技術であることができる。いくつかの場合に、変換後のDC値が小さければ小さいほど、かつ、AC係数が小さければ小さいほど、エントロピコーディング後にブロックを表すために所与の量子化ステップサイズで必要とされるビットはますます少ない。
【0008】
例えば、MPEG-2世代のコーディング技術から知られているような、従来のイントラコーディングは、イントラ予測を使用しない。しかし、いくつかのより新しいビデオ圧縮技術は、例えば、データの空間的に隣接しかつ復号化順序において先行するブロックの符号化/復号化中に得られた周囲サンプルデータ及び/又はメタデータから試みる技術を含む。かような技術は、以降「イントラ予測」技術と呼ばれる。少なくともいくつかの場合に、イントラ予測は、再構成中の現在ピクチャからの参照データのみを使用し、参照ピクチャからは使用しない点に留意されたい。
【0009】
多種多様な形態のイントラ予測が存在し得る。かような技術の1つよりも多くが所与のビデオコーディング技術で使用可能である場合に、使用中の技術はイントラ予測モードでコーディングされ得る。特定の場合に、モードは、サブモード及び/又はパラメータを有することができ、それらは、独立してコーディングされ得るか、又はモードコードワードに含まれ得る。所与のモード/サブモード/パラメータ組み合わせのためにどのコードワードを使用すべきは、イントラ予測を通じてコーディング効率利得に影響を及ぼし得るので、エントロピコーディング技術が、コードワードをビットストリームに変換するために使用され得る。
【0010】
特定のモードのイントラ予測が、H.264により導入され、H.265で洗練され、Joint Exploration Model(JEM)、Versatile Video Coding(VVC)、及びBenchmark Set(BMS)などのより新しいコーディング技術で更に洗練された。予測子ブロックは、既に利用可能なサンプルに属する隣接サンプル値を用いて形成され得る。隣接サンプルのサンプル値は、方向に応じて予測子ブロック内にコピーされる。使用中の方向の参照は、ビットストリームの中にコーディングされ得るか、又はそれ自体が予測されてもよい。
【0011】
図1Aを参照すると、右下には、H.265の33個のとり得る予測子方向(35個のイントラモードのうちの33個の角度モードに対応)から知られている9つの予測子方向のサブセットが表されている。矢印が集まる点(101)は、予測中のサンプルに相当する。矢印は、サンプルが予測されている方向を表す。例えば、矢印(102)は、サンプル(101)が、水平から45度の角度で右上にある1つ又は複数のサンプルから予測される、ことを示す。同様に、矢印(103)は、サンプル(101)が、水平から22.5度の角度でサンプル(101)の左下にある1つ又は複数のサンプルから予測される、ことを示す。
【0012】
依然として
図1Aを参照して、左上には、4×4個のサンプル(太破線によって示される。)の正方形ブロック(104)が表されている。正方形ブロック(104)は16個のサンプルを含み、各サンプルは、「S」、Y次元でのその位置(例えば、行インデックス)、及びX次元でのその位置(例えば、列インデックス)を用いてラベル付けされている。例えば、サンプルS21は、Y次元で(上から)2番目のサンプルかつX次元で(左から)1番目のサンプルである。同様に、サンプルS44は、Y及びXの両方の次元でブロック(104)内の4番目のサンプルである。ブロックはサイズが4×4サンプルであるということで、S44は右下にある。更には、類似した番号付け方式に従う参照サンプルが示されている。参照サンプルは、「R」と、ブロック(104)に対するそのY位置(例えば行インデックス)及びX位置(列インデックス)とを用いてラベル付けされている。H.264及びH.265の両方で、予測サンプルは再構成中のブロックに隣接するので、負値が使用される必要はない。
【0013】
イントラピクチャ予測は、シグナリングされた予測方向によって必要に応じて隣接サンプルから参照サンプル値をコピーすることによって、働くことができる。例えば、コーディングされたビデオビットストリームが、このブロックについて、矢印(102)と一致する予測方向を示す、すなわち、サンプルが水平から45度の角度で右上にある1つ以上の予測サンプルから予測される、とのシグナリングを含む、とする。その場合に、サンプルS41、S32、S23、及びS14は、同じ参照サンプルR05から予測される。次いで、サンプルS44が参照サンプルR08から予測される。
【0014】
特定の場合に、複数の参照サンプルの値は、参照サンプルを計算するために、特に、方向が45度で等しく分割可能でない場合に、例えば、補間を通じて、結合されてもよい。
【0015】
とり得る方向の数は、ビデオコーディング技術が発展するとともに増えている。H.264(2003年)では、9つの異なる方向が表現可能であった。それは、H.265(2013年)では33個にまで増え、そして、JEM/VVC/BMSは、本開示の時点で、最大65個の方向をサポートすることができる。最もありそうな方向を識別するために実験が行われており、エントロピコーディングにおける特定の技術は、可能性が低い方向に対する若干のペナルティを受け入れながら、少数のビットでそれらのありそうな方向を表現するよう使用されている。更に、方向それ自体は時々、隣接する、既に復号されたブロックで使用されている隣接方向から予測され得る。
【0016】
図1Bは、時間とともに増える予測方向の数を説明するために、JEMによる65個のイントラ予測方向を表す概略図(180)を示す。
【0017】
方向を表すコーディングされたビデオビットストリーム内のイントラ予測方向ビットのマッピングは、ビデオコーディング技術ごとに異なる可能性があり、例えば、予測方向の単純な直接マッピングから、イントラ予測モードまで、コードワードまで、最確モードを含む複雑な適応スキーム、及び同様の技術まで及び得る。全ての場合で、しかしながら、特定の他の方向よりも統計的にビデオコンテンツで起こる可能性が低い特定の方向が存在し得る。ビデオ圧縮の目標は冗長性の低減であるということで、それらの可能性が低い方向は、上手く働くビデオコーディング技術では、よりありそうな方向よりも多いビット数によって表現されることになる。
【0018】
動き補償は、不可逆圧縮技術であることができ、以前に再構成されたピクチャ又はその部分(参照ピクチャ)からのサンプルデータのブロックが、動きベクトル(以降MV)によって示された方向において空間的にシフトされた後に、新たに再構成されるピクチャ又はピクチャ部分の予測のために使用される技術に関係があり得る。いくつかの場合に、参照ピクチャは、現在再構成中のピクチャと同じであることができる。MVは2つの次元X及びY、又は3つの次元を有することができ、3番目の次元は、使用中の参照ピクチャの指示である(後者は、間接的に、時間次元であることができる。)。
【0019】
いくつかのビデオ圧縮技術では、サンプルデータの特定のエリアに適用可能なMVは、他のMVから、例えば、再構成中のエリアに空間的に隣接するサンプルデータの他のエリアに関係があり、復号化順序においてそのMVに先行するものから、予測され得る。そうすることで、MVをコーディングするために必要なデータの量を大幅に減らすことができ、それによって、冗長性を取り除きかつ圧縮を高める。例えば、カメラから得られた入力ビデオ信号(自然ビデオ(natural video)として知られる。)をコーディングする場合に、単一のMVが適用可能であるエリアよりも大きいエリアが同様の方向に移動するという統計的可能性があり、従って、いくつかの場合には、隣接するエリアのMVから導出された同様の動きベクトルを用いて予測可能であるということで、MV予測は有効に働くことができる。その結果、所与のエリアについて求められるMVは、周囲のMVから予測されたMVと類似又は同じであり、エントロピコーディング後に、MVを直接コーディングする場合に使用されることになるビット数よりも少ないビットで表され得る。いくつかの場合に、MV予測は、原信号(すなわち、サンプルストリーム)から導出された信号(すなわち、MV)の可逆圧縮の例であることができる。他の場合には、MV予測それ自体は、例えば、いくつかの周囲のMVから予測子を計算するときの丸め誤差のために、不可逆であり得る。
【0020】
様々なMV予測メカニズムがH.265/HEVC(ITU-T Rec. H265,“High Efficiency Video Coding”,2016年12月)で説明されている。H.265が提案する多くのMV予測メカニズムの中から、本明細書では、以降「空間マージ」(spatial merge)と呼ばれる技術が説明される。
【0021】
図2を参照すると、現在ブロック(201)は、空間的にシフトされている同じサイズの前のブロックから予測可能であると動き探索プロセス中にエンコーダによって認められたサンプルを有する。そのMVを直接にコーディングする代わりに、MVは、1つ以上の参照ピクチャと関連付けられたメタデータから、例えば、(復号化順序において)最も最近の参照ピクチャから、A0、A1及びB0、B1、B2(夫々、202乃至206)と表される5つの周囲サンプルのうちのいずれか1つと関連付けられたMVを用いて導出され得る。H.265では、MV予測は、隣接するブロックが使用している同じ参照ピクチャからの予測子を使用することができる。
【発明の概要】
【0022】
開示の態様は、ビデオデータ処理のための方法及び装置を提供する。いくつかの例で、ビデオデータ処理のための装置は処理回路を含む。例えば、処理回路は、ビットストリーム内のコーディングされたビデオデータの第1範囲でのコーディング制御のための第1シンタックス要素を決定する。第1シンタックス要素は、変換スキップモードでの残差コーディングのためのスライスベースRiceコーディングのコーディングツールに関連する。コーディングツールは、いくつかの例において、変換スキップモードでの残差コーディングのためのスライスレベルでのRiceパラメータを提供する。第1シンタックス要素が第1範囲でのコーディングツールの無効化を示す第1値であることに応答して、処理回路は、コーディングツールを呼び出さずに、コーディングされたビデオデータの1つ以上の第2範囲を含むコーディングされたビデオデータの第1範囲を復号する。
【0023】
いくつかの実施形態で、第1シンタックス要素は、出力レイヤセット内のピクチャのコーディング制御のための一般制約情報(general constraint information)に含まれる。いくつかの例において、第1シンタックス要素の第1値は、出力レイヤセット内の各コーディングレイヤビデオシーケンス(Coded Layer Video Sequence、CLVS)でコーディングツールを無効化することを示す。
【0024】
いくつかの実施形態で、第1シンタックス要素が第1値であることに応答して、処理回路は、ビットストリーム内のコーディングレイヤビデオシーケンス(CLVS)のコーディング制御のための第2シンタックス要素を、CLVSを復号するためにコーディングツールを呼び出さないことを示す値を有するように制約する。いくつかの例において、第2シンタックス要素の値は、CLVSのピクチャ内のスライスのスライスヘッダでのコーディングツールに関連したスライスヘッダフラグの不存在を示す。
【0025】
いくつかの実施形態において、第1シンタックス要素が第2値であり、変換スキップモードがコーディングレイヤビデオシーケンス(CLVS)で有効にされることに応答して、処理回路は、CLVSが参照するシーケンスパラメータセット(Sequence Parameter Set,SPS)内の第2シンタックス要素の値を復号する。第2シンタックス要素は、Riceパラメータの選択を示すスライスレベルシンタックス要素の存在/不存在を示す。第2シンタックス要素の値がスライスレベルシンタックス要素の存在を示すことに応答して、一例において、処理回路は、スライスのスライスヘッダから第3シンタックス要素を復号し、第3シンタックス要素は、変換スキップモードでのスライスの残差コーディングのためのRiceパラメータの選択を示す。
【0026】
いくつかの実施形態で、第2シンタックス要素がCLVSのSPSに存在しないことに応答して、処理回路は、CLVSでのコーディングツールの不使用を示す第2シンタックス要素の値を推測する。
【0027】
いくつかの例において、処理回路は、一般制約情報のためのシンタックス構造内のシンタックス要素がシンタックス構造内の一般制約情報のための追加ビットを示すことに応答して、シンタックス構造から第1シンタックス要素を復号する。
【0028】
開示の態様はまた、ビデオ復号化のためのコンピュータによって実行される場合に、コンピュータに、ビデオ復号化のための法法を実行させる命令を記憶している非一時的なコンピュータ可読記憶媒体も提供する。
【0029】
開示されている対象の更なる特徴、性質、及び様々な利点は、以下の詳細な説明及び添付の図面からより明らかになる。
【図面の簡単な説明】
【0030】
【
図1A】イントラ予測モードの例示的なサブセットの模式図である。
【
図1B】例示的なイントラ予測方向の説明図である。
【
図2】一例における現在のブロック及びその周囲空間マージ候補の模式図である。
【
図3】実施形態に係る通信システム(300)の略ブロック図の模式図である。
【
図4】実施形態に係る通信システム(400)の略ブロック図の模式図である。
【
図5】実施形態に係るデコーダの略ブロック図の模式図である。
【
図6】実施形態に係るエンコーダの略ブロック図の模式図である。
【
図7】他の実施形態に係るエンコーダのブロック図を示す。
【
図8】他の実施形態に係るデコーダのブロック図を示す。
【
図9】本開示の実施形態に係る適応解像度変更(ARC)パラメータのシグナリングの例を示す。
【
図10】アップサンプリング又はダウンサンプリング係数、コードワード、及びExt-Golombコードのマッピングについてのテーブル(1000)の例を示す。
【
図11】本開示の実施形態に係るARCパラメータシグナリングのいくつかの例を示す。
【
図12】いくつかの例におけるPTLシンタックス要素の組のシンタックス構造例を示す。
【
図13】いくつかの例における一般制約情報のシンタックス構造例を示す。
【
図14A】本開示のいくつかの実施形態に係るPTLシンタックス構造及び一般制約情報シンタックス構造を含むPTL情報の例を示す。
【
図14B】本開示のいくつかの実施形態に係るPTLシンタックス構造及び一般制約情報シンタックス構造を含むPTL情報の例を示す。
【
図15A】本開示の実施形態に係る一般制約情報シンタックス構造の例を示す。
【
図15B】本開示の実施形態に係る一般制約情報シンタックス構造の例を示す。
【
図16】本開示のいくつかの実施形態に係る一般制約情報のシンタックス構造を示す。
【
図17】本開示のいくつかの実施形態に係るシーケンスパラメータセット(SPS)範囲拡張のシンタックス構造例を示す。
【
図18】本開示の実施形態に係るプロセスを説明するフローチャートを示す。
【
図19】本開示の実施形態に係るプロセスを説明するフローチャートを示す。
【
図20】実施形態に係るコンピュータシステムの模式図である。
【発明を実施するための形態】
【0031】
図3は、本開示の実施形態に係る通信システム(300)の略ブロック図を表す。通信システム(300)は、例えば、ネットワーク(350)を介して、互いと通信することができる複数の端末デバイスを含む。例えば、通信システム(300)は、ネットワーク(350)を介して相互接続されている端末デバイス(310)及び(320)の第1対を含む。
図3の例では、端末デバイス(310)及び(320)の第1対は、データの一方向伝送を実行する。例えば、端末デバイス(310)は、ネットワーク(350)を介した他の端末デバイス(320)への伝送のために、ビデオデータ(例えば、端末デバイス(310)によって捕捉されるビデオピクチャのストリーム)をコーディングしてよい。符号化されたビデオデータは、1つ以上のコーディングされたビデオビットストリームの形で伝送可能である。端末デバイス(320)は、コーディングされたビデオデータをネットワーク(350)から受信し、コーディングされたビデオデータを復号してビデオピクチャを回復し、回復されたビデオデータに従ってビデオピクチャを表示してよい。一方向データ伝送は、メディアサービングアプリケーションなどにおいて一般的であり得る。
【0032】
他の例では、通信システム(300)は、例えば、ビデオ会議中に、現れ得るコーディングされたビデオデータの双方向伝送を実行する端末デバイス(330)及び(340)の第2対を含む。データの双方向伝送のために、例において、端末デバイス(330)及び(340)の各端末デバイスは、ネットワーク(350)を介した端末デバイス(330)及び(340)のうちの他方の端末デバイスへの伝送のために、ビデオデータ(例えば、その端末デバイスによって捕捉されるビデオピクチャのストリーム)をコーディングしてよい。端末デバイス(330)及び(340)の各端末デバイスはまた、端末デバイス(330)及び(340)のうちの他方の端末デバイスによって送信されたコーディングされたビデオデータを受信してよく、コーディングされたビデオデータを復号してビデオピクチャを回復してよく、回復されたビデオデータに従って、アクセス可能な表示デバイスでビデオピクチャを表示してよい。
【0033】
図3の例では、端末デバイス(310)、(320)、(330)及び(340)は、サーバ、パーソナルコンピュータ、及びスマートフォンとして表され得るが、本開示の原理はそのように限定されなくてもよい。本開示の実施形態は、ラップトップコンピュータ、タブレットコンピュータ、メディアプレイヤー、及び/又は専用のビデオ会議装置により用途を見出す。ネットワーク(350)は、例えば、ワイヤライン(有線)及び/又はワイヤレス通信ネットワークを含む、コーディングされたビデオデータを端末デバイス(310)、(320)、(330)及び(340)の間で伝達する任意数のネットワークに相当する。通信ネットワーク(350)は、回路交換及び/又はパケット交換チャネルにおいてデータを交換してもよい。代表的なネットワークには、電気通信網、ローカルエリアネットワーク、ワイドエリアネットワーク及び/又はインターネットがある。本議論のために、ネットワーク(350)のアーキテクチャ及びトポロジは、本明細書において以降で説明されない限りは、本開示の動作に無関係であってよい。
【0034】
図4は、開示されている対象の応用例として、ストリーミング環境におけるビデオエンコーダ及びビデオデコーダの配置を表す。開示されている対象は、例えば、ビデオ会議と、デジタルTVと、CD、DVD、メモリスティックなどを含むデジタル媒体上での圧縮されたビデオの記憶と、などを含む他のビデオ対応用途に同様に適用可能であることができる。
【0035】
ストリーミングシステムは、例えば、圧縮されていないビデオピクチャのストリーム(402)を生成するビデオソース(401)、例えば、デジタルカメラ、を含むことができる捕捉サブシステム(413)を含んでよい。例において、ビデオピクチャのストリーム(402)は、デジタルカメラによって撮影されるサンプルを含む。ビデオピクチャのストリーム(402)は、符号化されたビデオデータ(404)(又はコーディングされたビデオビットストリーム)と比較して高いデータボリュームを強調するために太線で表されており、ビデオソース(401)へ結合されたビデオエンコーダ(403)を含む電子機器(420)によって処理され得る。ビデオエンコーダ(403)は、以下で更に詳細に記載されるように、開示されている対象の態様を可能にする又は実装するためのハードウェア、ソフトウェア、又はそれらの組み合わせを含むことができる。符号化されたビデオデータ(404)(又は符号化されたビデオビットストリーム(404))は、ビデオピクチャのストリーム(402)と比較してより低いデータボリュームを強調するために細線で表されており、将来の使用のためにストリーミングサーバ(405)に記憶され得る。
図4のクライアントサブシステム(406)及び(408)などの1つ以上のストリーミングクライアントサブシステムは、符号化されたビデオデータ(404)のコピー(407)及び(409)を読み出すためにストリーミングサーバ(405)にアクセスすることができる。クライアントサブシステム(406)は、例えば、電子機器(430)において、ビデオデコーダ(410)を含むことができる。ビデオデコーダ(410)は、符号化されたビデオデータの入来するコピー(407)を復号し、ディスプレイ(412)(例えば、表示スクリーン)又は他のレンダリングデバイス(図示せず。)でレンダリング可能なビデオピクチャの送出ストリーム(411)を生成する。いくつかのストリーミングシステムにおいて、符号化されたビデオデータ(404)、(407)、及び(409)(例えば、ビデオビットストリーム)は、特定のビデオコーディング/圧縮規格に従って符号化され得る。そのような規格の例には、ITU-T推奨H.265がある。例において、開発中のビデオコーディング規格は、Versatile Video Coding(VVC)として俗に知られている。開示されている対象は、VVCに関連して使用されてもよい。
【0036】
電子機器(420)及び(430)は、他のコンポーネント(図示せず。)を含むことができる。例えば、電子機器(420)は、ビデオデコーダ(図示せず。)を含むことができ、電子機器(430)は、ビデオエンコーダ(図示せず。)を同様に含むことができる。
【0037】
図5は、本開示の実施形態に係るビデオデコーダ(510)のブロック図を示す。ビデオデコーダ(510)は、電子機器(530)に含まれ得る。電子機器(530)は、受信器(531)(例えば、受信回路)を含むことができる。ビデオデコーダ(510)は、
図4の例のビデオデコーダ(410)の代わりに使用され得る。
【0038】
受信器(531)は、ビデオデコーダ(510)によって復号されるべき1つ以上のコーディングされたビデオシーケンスを、同じ又は他の実施形態では、一度に1つのコーディングされたビデオシーケンスを、受信してよい。このとき、夫々のコーディングされたビデオシーケンスの復号化は、他のコーディングされたビデオシーケンスから独立している。コーディングされたビデオシーケンスは、チャネル(501)から受信されてよく、チャネルは、符号化されたビデオデータを記憶している記憶デバイスへのハードウェア/ソフトウェアリンクであってよい。受信器(531)は、符号化されたビデオデータを他のデータ、例えば、コーディングされたオーディオデータ及び/又は補助的なデータストリームとともに受信してもよく、それらは、それらの各々の使用エンティティ(図示せず。)へ転送されてよい。受信器(531)は、コーディングされたビデオシーケンスを他のデータから分離してよい。ネットワークジッタに対抗するために、バッファメモリ(515)が受信器(531)とエントロピデコーダ/パーサ(520)(以降「パーサ(520)」)との間に結合されてよい。特定の用途では、バッファメモリ(515)は、ビデオデコーダ(510)の部分である。他では、それは、ビデオデコーダ(510)の外にあることができる(図示せず。)。更に他では、例えば、ネットワークジッタに対抗するための、ビデオデコーダ(510)の外にあるバッファメモリ(図示せず。)と、加えて、例えば、再生タイミングを操作するための、ビデオデコーダ(510)内のもう1つのバッファメモリ(515)とが存在することができる。受信器(531)が十分なバンド幅及び可制御性の記憶/転送デバイスから、又はアイソシンクロナス(isosynchronous)ネットワークからデータを受信しているときに、バッファメモリ(515)は必要とされなくてもよく、あるいは、小さいことが可能である。インターネットなどのベストエフォートのパケットネットワークでの使用のために、バッファメモリ(515)は必要とされる場合があり、比較的に大きいことが可能であり、有利なことには、適応サイズであることができ、ビデオデコーダ(510)の外のオペレーティングシステム又は同様の要素(図示せず。)で少なくとも部分的に実装され得る。
【0039】
ビデオデコーダ(510)は、コーディングされたビデオシーケンスからシンボル(521)を再構成するためのパーサ(520)を含んでよい。それらのシンボルのカテゴリは、ビデオデコーダ(510)の動作を管理するために使用される情報と、潜在的に、電子機器(530)の必須部分でないが、
図5に示されたように、電子機器(530)へ結合され得るレンダーデバイス(512)(例えば、表示スクリーン)などのレンダリングデバイスを制御するための情報とを含む。レンダリングデバイスのための制御情報は、補助強化情報(Supplemental Enhancement Information,SEI)メッセージ又はビデオユーザビリティ情報(Video Usability Information,VUI)パラメータセットフラグメント(図示せず。)の形をとってよい。パーサ(520)は、受信されるコーディングされたビデオシーケンスをパース/エントロピ復号してよい。コーディングされたビデオシーケンスのコーディングは、ビデオコーディング技術又は標準規格に従うことができ、可変長コーディング、ハフマンコーディング、文脈依存による又はよらない算術コーディング、などを含む様々な原理に従うことができる。パーサ(520)は、コーディングされたビデオシーケンスから、ビデオデコーダにおけるピクセルのサブグループのうちの少なくとも1つについてのサブグループパラメータの組を、そのグループに対応する少なくとも1つのパラメータに基づいて抽出し得る。サブグループは、グループ・オブ・ピクチャ(Group of Picture,GOP)、ピクチャ、タイル、スライス、マクロブロック、コーディングユニット(Coding Unit,CU)、ブロック、変換ユニット(Transform Unit,TU)、予測ユニット(Prediction Unit,PU)、などを含むことができる。パーサ(520)はまた、コーディングされたビデオシーケンスから、変換係数、量子化器パラメータ値、動きベクトル、などの情報も抽出し得る。
【0040】
パーサ(520)は、シンボル(521)を生成するために、バッファメモリ(515)から受信されたビデオシーケンスに対してエントロピ復号化/パーシング動作を実行してよい。
【0041】
シンボル(521)の再構成は、コーディングされたビデオピクチャ又はその部分(例えば、インター及びイントラピクチャ、インター及びイントラブロック)のタイプ及び他の因子に応じて多数の異なるユニットを有することができる。どのユニットがどのように含まれるかは、コーディングされたビデオシーケンスからパーサ(520)によってパースされたサブグループ制御情報によって制御され得る。パーサ(520)と以下の複数のユニットとの間のそのようなサブグループ制御情報のフローは、明りょうさのために表されていない。
【0042】
既に述べられた機能ブロックを超えて、ビデオデコーダ(510)は、概念的に、以下で説明される多数の機能ユニットに細分され得る。商業上の制約の下で動作する実際の実施では、それらのユニットの多くが互いに密に相互作用し、少なくとも部分的に互いに組み込まれ得る。しかし、開示されている対象を説明することを目的として、以下での機能ユニットへの概念的細分は適切である。
【0043】
第1ユニットは、スケーラ/逆変換ユニット(551)である。スケーラ/逆変換ユニット(551)は、パーサ(520)からシンボル(521)として、量子化された変換係数とともに、どの変換を使用すべきか、ブロックサイズ、量子化係数、量子化スケーリングマトリクスなどを含む制御情報を受信する。スケーラ/逆変換ユニット(551)は、アグリゲータ(555)へ入力することができるサンプル値を含むブロックを出力することができる。
【0044】
いくつかの場合に、スケーラ/逆変換器(551)の出力サンプルは、イントラコーディングされたブロック、すなわち、前に再構成されたピクチャからの予測情報を使用しておらず、現在ピクチャの前に再構成された部分からの予測情報を使用することができるブロック、に関係することができる。かような予測情報は、イントラピクチャ予測ユニット(552)によって供給され得る。いくつかの場合に、イントラピクチャ予測ユニット(552)は、現在ピクチャバッファ(558)からフェッチされた周囲の既に再構成された情報を用いて、再構成中のブロックと同じサイズ及び形状のブロックを生成する。現在ピクチャバッファ(558)は、例えば、部分的に再構成された現在ピクチャ及び/又は完全に再構成された現在ピクチャをバッファリングする。アグリゲータ(555)は、いくつかの場合に、サンプルごとに、イントラ予測ユニット(552)が生成した予測情報を、スケーラ/逆変換ユニット(551)によって供給される出力サンプル情報に加える。
【0045】
他の場合では、スケーラ/逆変換ユニット(551)の出力サンプルは、インターコーディングされた、そして潜在的に、動き補償されたブロックに関係することができる。かような場合に、動き補償予測ユニット(553)は、予測のために使用されるサンプルをフェッチするよう参照ピクチャメモリ(557)にアクセスすることができる。ブロックに関係するシンボル(521)に従って、フェッチされたサンプルを動き補償した後に、それらのサンプルは、出力サンプル情報を生成するために、アグリゲータ(555)によって、スケーラ/逆変換ユニット(551)の出力(この場合に、残差サンプル又は残差信号と呼ばれる。)に加えられ得る。動き補償予測ユニット(553)が予測サンプルをフェッチする参照ピクチャメモリ(557)内のアドレスは、例えば、X、Y及び参照ピクチャコンポーネントを有することができるシンボル(521)の形で動き補償予測ユニット(553)が利用することができる動きベクトルによって、制御され得る。動き補償はまた、サブサンプルの正確な動きベクトルが使用されているときに参照ピクチャメモリ(557)からフェッチされるサンプル値の補間や、動きベクトル予測メカニズムなどを含むこともできる。
【0046】
アグリゲータ(555)の出力サンプルは、ループフィルタユニット(556)において様々なループフィルタリング技術を受けることができる。ビデオ圧縮技術は、インループフィルタ技術を含むことができる。この技術は、コーディングされたビデオシーケンス(コーディングされたビデオビットストリームとも呼ばれる。)に含まれており、パーサ(520)からのシンボル(521)としてループフィルタユニット(556)に利用可能にされたパラメータによって制御されるが、コーディングされたピクチャ又はコーディングされたビデオシーケンスの(復号化順序において)前の部分の復号化中に得られたメタ情報にも応答することができ、更には、前に構成されたループフィルタ処理されたサンプル値に応答することもできる。
【0047】
ループフィルタユニット(556)の出力は、レンダーデバイス(512)へ出力され、更には、将来のインターピクチャ予測における使用のために参照ピクチャメモリ(557)に記憶され得るサンプルストリームであることができる。
【0048】
特定のコーディングされたピクチャは、完全に再構成されると、将来の予測のための参照ピクチャとして使用され得る。例えば、現在ピクチャに対応するコーディングされたピクチャが完全に再構成され、コーディングされたピクチャが(例えば、パーサ(520)によって)参照ピクチャとして識別されると、現在ピクチャバッファ(558)は、参照ピクチャメモリ(557)の部分になることができ、未使用の現在ピクチャバッファが、後続のコーディングされたピクチャの再構成を開始する前に再割り当てされ得る。
【0049】
ビデオデコーダ(510)は、ITU-T推奨H.265などの標準規格における所定のビデオ圧縮技術に従って復号化動作を実行してよい。コーディングされたビデオシーケンスは、そのコーディングされたビデオシーケンスが、ビデオ圧縮技術又は標準規格のシンタックス及びビデオ圧縮技術又は標準規格において文書化されているプロファイルの両方に従うという意味で、使用中のビデオ圧縮技術又は標準規格によって規定されたシンタックスに従い得る。具体的には、プロファイルは、ビデオ圧縮技術又は標準規格で利用可能な全てのツールから、そのプロファイルの下での使用のために利用可能な唯一のツールとして、特定のツールを選択することができる。また、コーディングされたビデオシーケンスの複雑さは、ビデオ圧縮技術又は標準規格のレベルによって定義された境界内にあることが、順守のために必要である。いくつかの場合に、レベルは、最大ピクチャサイズ、最大フレームレート、最大再構成サンプルレート(例えば、メガサンプル/秒で測定される。)、最大参照ピクチャサイズ、などを制限する。レベルによって設定された制限は、いくつかの場合に、仮想参照デコーダ(Hypothetical Reference Decoder,HRD)仕様と、コーディングされたビデオシーケンスにおいて通知されるHRDバッファ管理のためのメタデータとを通じて、更に制限され得る。
【0050】
実施形態において、受信器(531)は、符号化されたビデオとともに、追加の(冗長な)データを受信してもよい。追加のデータは、コーディングされたビデオシーケンスの部分として含まれてもよい。追加のデータは、ビデオデコーダ(510)によって、データを適切に復号するために及び/又は原ビデオデータをより正確に再構成するために使用されてよい。追加のデータは、例えば、時間、空間、又は信号対雑音比(SNR)エンハンスメントレイヤ、冗長スライス、冗長ピクチャ、前方誤り訂正符号、などの形をとることができる。
【0051】
図6は、本開示の実施形態に係るビデオエンコーダ(603)のブロック図を示す。ビデオエンコーダ(603)は、電子機器(620)に含まれている。電子機器(620)は、送信器(640)(例えば、送信回路)を含む。ビデオエンコーダ(603)は、
図4の例のビデオエンコーダ(403)の代わりに使用され得る。
【0052】
ビデオエンコーダ(603)は、ビデオエンコーダ(603)によってコーディングされるべきビデオ画像を捕捉し得るビデオソース(601)(
図6の例では電子機器(620)の部分ではない。)からビデオサンプルを受信してよい。他の例では、ビデオソース(601)は、電子機器(620)の部分である。
【0053】
ビデオソース(601)は、任意の適切なビットデプス(例えば、8ビット、10ビット、12ビットなど)、任意の色空間(例えば、BT.601 YCrCB、RGBなど)、及び任意の適切なサンプリング構造(例えば、YCrCb 4:2:0、YCrCb 4:4:4)であることができるデジタルビデオサンプルストリームの形で、ビデオエンコーダ(603)によってコーディングされるべきソースビデオシーケンスを供給してよい。メディアサービングシステムでは、ビデオソース(601)は、予め準備されたビデオを記憶している記憶デバイスであってよい。ビデオ会議システムでは、ビデオソース(601)は、ローカル画像情報をビデオシーケンスとして捕捉するカメラであってよい。ビデオデータは、順に見られる場合に動きを授ける複数の個別ピクチャとして供給されてもよい。ピクチャ自体は、ピクセルの空間アレイとして編成されてよく、各ピクセルは、使用中のサンプリング構造、色空間、などに依存する1つ以上のサンプルを有することができる。当業者であれば、ピクセルとサンプルとの間の関係を容易に理解することができる。本明細書は、以下、サンプルに焦点を当てる。
【0054】
実施形態に従って、ビデオエンコーダ(603)は、実時間において、又は用途によって必要とされる任意の他の時間制約の下で、ソースビデオシーケンスのピクチャを、コーディングされたビデオシーケンス(643)へとコーディング及び圧縮してよい。適切なコーディング速度を強いることは、コントローラ(650)の一機能である。いくつかの実施形態において、コントローラ(650)は、以下で記載されるような他の機能ユニットを制御し、他の機能ユニットへ機能的に結合される。結合は明りょうさのために表されていない。コントローラ(650)によってセットされるパラメータには、レート制御に関連したパラメータ(ピクチャスキップ、量子化器、レートひずみ最適化技術のラムダ値、など)、ピクチャサイズ、グループ・オブ・ピクチャ(GOP)レイアウト、最大動きベクトル探索範囲、などが含まれ得る。コントローラ(650)は、特定のシステム設計のために最適化されたビデオエンコーダ(603)に関係する他の適切な機能を有するよう構成され得る。
【0055】
いくつかの実施形態において、ビデオエンコーダ(603)は、コーディングループで動作するよう構成される。過度に単純化された記載として、例において、コーディングループは、ソースコーダ(630)(例えば、コーディングされるべき入力ピクチャと、参照ピクチャとに基づいて、シンボルストリームなどのシンボルを生成することに関与する。)と、ビデオエンコーダ(603)に埋め込まれた(ローカル)デコーダ(633)とを含むことができる。デコーダ(633)は、(シンボルとコーディングされたビデオストリームとの間の如何なる圧縮も、開示されている対象で考えられているビデオ圧縮技術において可逆であるということで)(遠隔の)デコーダも生成することになるのと同様の方法でサンプルデータを生成するようにシンボルを再構成する。再構成されたサンプルストリーム(サンプルデータ)は、参照ピクチャメモリ(634)へ入力される。シンボルストリームの復号化は、デコーダの場所(ローカル又は遠隔)に依存しないビットパーフェクト(bit-exact)な結果をもたらすので、参照ピクチャメモリ(634)内のコンテンツも、ローカルのエンコーダと遠隔のエンコーダとの間でビットパーフェクトである。すなわち、エンコーダの予測部分は、デコーダが復号化中に予測を使用するときに“見る”ことになるのとまさに同じサンプル値を参照ピクチャサンプルとして“見る”。参照ピクチャのシンクロニシティ(及び、例えば、チャネルエラーのために、シンクロニシティが維持され得ない場合に、結果として生じるドリフト)のこの基本原理は、いくつかの関連技術でも使用されている。
【0056】
“ローカル”のデコーダ(633)の動作は、
図5とともに詳細に既に上述されている、ビデオデコーダ(510)などの“遠隔”のデコーダと同じであることができる。一時的に
図5も参照すると、しかしながら、シンボルが利用可能であり、エントロピコーダ(645)及びパーサ(520)によるコーディングされたビデオシーケンスへのシンボルの符号化/復号化が可逆であることができるということで、バッファメモリ(515)及びパーサ(520)を含むビデオデコーダ(510)のエントロピ復号化部分は、ローカルのデコーダ(633)において完全には実装されなくてもよい。
【0057】
この時点で観察できることは、デコーダに存在するパーシング/エントロピ復号化を除く如何なるデコーダ技術も、必然的に、対応するエンコーダにおいて略同じ機能形態で存在する必要がある、ということである。この理由により、開示されている対象は、デコーダの動作に焦点を当てる。エンコーダ技術の説明は、それらが、包括的に記載されるデコーダ技術の逆であるということで、省略され得る。特定の範囲においてのみ、より詳細な説明が必要とされ、以下で与えられている。
【0058】
動作中、いくつかの例では、ソースコーダ(630)は、動き補償された予測コーディングを実行してよい。これは、「参照ピクチャ」として指定された、ビデオシーケンスからの1つ以上の前にコーディングされたピクチャを参照して、予測的に入力ピクチャをコーディングする。このようにして、コーディングエンジン(632)は、入力ピクチャに対する予測参照として選択され得る参照ピクチャのピクセルブロックと入力ピクチャのピクセルブロックとの間の差をコーディングする。
【0059】
ローカルのビデオデコーダ(633)は、ソースコーダ(630)によって生成されたシンボルに基づいて、参照ピクチャとして指定され得るピクチャのコーディングされたビデオデータを復号してよい。コーディングエンジン(632)の動作は、有利なことに、不可逆プロセスであってよい。コーディングされたビデオデータがビデオデコーダ(
図6には図示せず。)で復号され得るとき、再構成されたビデオシーケンスは、通常は、いくらかのエラーを伴ったソースビデオシーケンスの複製であり得る。ローカルのビデオデコーダ(633)は、参照ピクチャに対してビデオデコーダによって実行され得る復号化プロセスを再現し、再構成された参照ピクチャを参照ピクチャキャッシュ(634)に格納されるようにしてよい。このように、ビデオエンコーダ(603)は、(伝送エラーなしで)遠端のビデオデコーダによって取得されることになる再構成された参照ピクチャと共通の内容を有している再構成された参照ピクチャのコピーをローカルで記憶し得る。
【0060】
予測器(635)は、コーディングエンジン(632)のための予測探索を実行してよい。すなわち、新しいピクチャがコーディングされるために、予測器(635)は、その新しいピクチャのための適切な予測基準となり得る参照ピクチャ動きベクトル、ブロック形状、などの特定のメタデータ又は(候補参照ピクセルブロックとしての)サンプルデータを参照ピクチャメモリ(634)から探してよい。予測器(635)は、適切な予測基準を見つけるためにサンプルブロック・バイ・ピクセルブロックベース(sample block-by-pixel block basis)で動作してよい。いくつかの場合に、予測器(635)によって取得された探索結果によって決定されるように、入力ピクチャは、参照ピクチャメモリ(634)に記憶されている複数の参照ピクチャから引き出された予測基準を有してよい。
【0061】
コントローラ(650)は、例えば、ビデオデータを符号化するために使用されるパラメータ及びサブグループパラメータの設定を含め、ソースコーダ(630)のコーディング動作を管理してよい。
【0062】
上記の全ての機能ユニットの出力は、エントロピコーダ(645)においてエントロピコーディングを受けてよい。エントロピコーダ(645)は、ハフマンコーディング、可変長コーディング、算術コーディングなどの技術に従ってシンボルを可逆圧縮することによって、様々な機能ユニットによって生成されたシンボルを、コーディングされたビデオシーケンスへと変換する。
【0063】
送信器(640)は、エントロピコーダ(645)によって生成されたコーディングされたビデオシーケンスを、通信チャネル(660)を介した伝送のために準備するようにバッファリングしてよい。通信チャネル(660)は、符号化されたビデオデータを記憶する記憶デバイスへのハードウェア/ソフトウェアリンクであってよい。送信器(640)は、ビデオコーダ(603)からのコーディングされたビデオデータを、送信されるべき他のデータ、例えば、コーディングされたオーディオデータ及び/又は補助的なデータストリーム(ソースは図示せず)とマージしてもよい。
【0064】
コントローラ(650)は、ビデオエンコーダ(603)の動作を管理してよい。コーディング中、コントローラ(650)は、各々のピクチャに適用され得るコーディング技術に影響を及ぼす可能性がある特定のコーディングされたピクチャタイプを夫々のコーディングされたピクチャに割り当ててよい。例えば、ピクチャはしばしば、次のピクチャタイプのうちの1つとして割り当てられてよい。
【0065】
イントラピクチャ(Intra Picture)(Iピクチャ)は、予測のソースとしてシーケンス内の如何なる他のピクチャも使用せずに符号化及び復号化され得るピクチャであってよい。いくつかのビデオコーデックは、例えば、独立デコーダリフレッシュ(Independent Decoder Refresh,IDR)ピクチャを含む種々のタイプのイントラピクチャを許容する。当業者であれば、Iピクチャのそのような変形並びにそれらの各々の応用及び特徴を知っている。
【0066】
予測ピクチャ(Predictive Picture)(Pピクチャ)は、各ブロックのサンプル値を予測するために多くても1つの動きベクトル及び参照インデックスを用いてイントラ予測又はインター予測により符号化及び復号化され得るピクチャであってよい。
【0067】
双方向予測ピクチャ(Bi-directionally Predictive Picture)(Bピクチャ)は、各ブロックのサンプル値を予測するために多くても2つの動きベクトル及び参照インデックスを用いてイントラ予測又はインター予測により符号化及び復号化され得るピクチャであってよい。同様に、多重予測ピクチャ(multiple-predictive picture(s))は、単一のブロックの再構成のために2つよりも多い参照ピクチャ及び関連するメタデータを使用することができる。
【0068】
ソースピクチャは、一般に、複数のサンプルブロック(例えば、夫々、4×4、8×8、4×8、又は16×16のサンプルのブロック)に空間的に細分され、ブロックごとにコーディングされてよい。ブロックは、ブロックの各々のピクチャに適用されているコーディング割り当てによって決定される他の(既にコーディングされた)ブロックを参照して予測的にコーディングされてよい。例えば、Iピクチャのブロックは、非予測的にコーディングされてよく、あるいは、それらは、同じピクチャの既にコーディングされたブロックを参照して予測的にコーディングされてもよい(空間予測又はイントラ予測)。Pピクチャのピクセルブロックは、1つの前にコーディングされた参照ピクチャを参照して空間予測により又は時間予測により、予測的にコーディングされてよい。Bピクチャのブロックは、1つ又は2つの前にコーディングされた参照ピクチャを参照して空間予測により又は時間予測により、予測的にコーディングされてよい。
【0069】
ビデオエンコーダ(603)は、ITU-T推奨H.265のような所定のビデオコーディング技術又は標準規格に従ってコーディング動作を実行してよい。その動作中に、ビデオエンコーダ(603)は、入力ビデオシーケンスにおける時間及び空間冗長性を利用する予測コーディング動作を含む様々な圧縮動作を実行してよい。従って、コーディングされたビデオデータは、使用されているビデオコーディング技術又は標準規格によって定められているシンタックスに従い得る。
【0070】
実施形態において、送信器(640)は、符号化されたビデオとともに追加のデータを送信してもよい。ソースコーダ(630)は、コーディングされたビデオシーケンスの部分としてそのようなデータを含めてよい。追加のデータは、時間/空間/SNRエンハンスメントレイヤ、冗長ピクチャ及びスライスなどの他の形式の冗長データ、SEIメッセージ、VUIパラメータセットフラグメント、などを有してよい。
【0071】
ビデオは、時間シーケンスにおいて複数のソースピクチャ(ビデオピクチャ)として捕捉されてよい。イントラピクチャ予測(しばしばイントラ予測と省略される。)は、所与のピクチャにおける空間相関を利用し、インターピクチャ予測は、ピクチャ間の(時間又は他の)相関を利用する。例において、現在ピクチャ(current picture)と呼ばれる、符号化/復号化中の特定のピクチャは、ブロックにパーティション化される。現在ピクチャ内のあるブロックが、ビデオの前にコーディングされて依然としてバッファリングされている参照ピクチャ内の参照ブロックと類似している場合に、現在ピクチャ内のそのブロックは、動きベクトル(motion vector)と呼ばれるベクトルによってコーディングされ得る。動きベクトルは、参照ピクチャ内の参照ブロックを指し示し、複数の参照ピクチャが使用されている場合には、参照ピクチャを識別する第3の次元を有することができる。
【0072】
いくつかの実施形態において、双予測技術がインターピクチャ予測において使用され得る。双予測技術に従って、2つの参照ピクチャ、例えば、ビデオ内で現在ピクチャに対して復号化順序において両方とも先行する(しかし、表示順序では、夫々、過去及び将来にあってよい。)第1参照ピクチャ及び第2参照ピクチャが、使用される。現在ピクチャ内のあるブロックは、第1参照ピクチャ内の第1参照ブロックを指し示す第1動きベクトルと、第2参照ピクチャ内の第2参照ブロックを指し示す第2動きベクトルとによって、コーディングされ得る。そのブロックは、第1参照ブロック及び第2参照ブロックの組み合わせによって予測可能である。
【0073】
更に、マージモード技術が、コーディング効率を改善するためにインターピクチャ予測において使用され得る。
【0074】
本開示のいくつかの実施形態に従って、インターピクチャ予測及びイントラピクチャ予測などの予測は、ブロックの単位で実行される。例えば、HEVC標準規格に従って、ビデオピクチャのシーケンス内のピクチャは、圧縮のためにコーディングツリーユニット(Coding Tree Unit,CTU)にパーティション化され、ピクチャ内のCTUは、64×64ピクセル、32×32ピクセル、又は16×16ピクセルといった同じサイズを有する。一般に、CTUは、1つのルーマCTB及び2つのクロマCTBである3つのコーディングツリーブロック(Coding Tree Block,CTB)を含む。各CTUは、1つ又は複数のコーディングユニット(Coding Unit,CU)に再帰的に四分木分割され得る。例えば、64×64ピクセルのCTUは、64×64ピクセルの1つのCU、又は32×32ピクセルの4つのCU、又は16×16ピクセルの16個のCUに分割可能である。例において、各CUは、インター予測タイプ又はイントラ予測タイプなどの、当該CUのための予測タイプを決定するよう、解析される。CUは、時間及び/又は空間予測可能性に応じて1つ以上の予測ユニット(Prediction Unit,PU)に分割される。一般に、各PUは、1つのルーマ予測ブロック(Prediction Block,PB)及び2つのクロマPBを含む。実施形態において、コーディング(符号化/復号化)における予測動作は、予測ブロックの単位で実行される。予測ブロックの例としてルーマ予測ブロックを使用すると、予測ブロックは、8×8ピクセル、16×16ピクセル、8×16ピクセル、16×8ピクセルなどのような、ピクセルの値(例えば、ルーマ値)の行列を含む。
【0075】
図7は、開示の他の実施形態に係るビデオエンコーダ(703)の図を示す。ビデオエンコーダ(703)は、ビデオピクチャの連続に含まれる現在ビデオピクチャ内のサンプル値の処理ブロック(例えば、予測ブロック)を受け取り、コーディングされたビデオシーケンスの部分であるコーディングされたピクチャへと処理ブロックを符号化するよう構成される。例において、ビデオエンコーダ(703)は、
図4の例のビデオエンコーダ(403)の代わりに使用される。
【0076】
HEVCの例では、ビデオエンコーダ(703)は、8×8サンプルの予測ブロックなどのような処理ブロックのためのサンプル値の行列を受け取る。ビデオエンコーダ(703)は、例えば、レートひずみ最適化を用いて、処理ブロックがイントラモード、インターモード、又は双予測モードにより最も良くコーディングされるかどうかを決定する。処理ブロックがイントラモードでコーディングされるべきである場合には、ビデオエンコーダ(703)は、コーディングされたピクチャへと処理ブロックを符号化するためにイントラ予測技術を使用してよく、処理ブロックがインターモード又は双予測モードでコーディングされるべきである場合には、ビデオエンコーダ(703)は、コーディングされたピクチャへと処理ブロックを符号化するためにインター予測又は双予測技術を夫々使用してよい。特定のビデオコーディング技術において、マージモードは、予測子の外にあるコーディングされた動きベクトル成分の恩恵を受けずに1つ以上の動きベクトル予測子から動きベクトルが導出されるインターピクチャ予測サブモードであることができる。特定の他のビデオコーディング技術では、対象ブロックに適用可能な動きベクトル成分が存在する場合がある。例において、ビデオエンコーダ(703)は、処理ブロックのモードを決定するモード決定モジュール(図示せず。)などの他のコンポーネントを含む。
【0077】
図7の例では、ビデオエンコーダ(703)は、
図7に示されるように結合されているインターエンコーダ(730)、イントラエンコーダ(722)、残差計算部(723)、スイッチ(726)、残差エンコーダ(724)、汎用コントローラ(721)、及びエントロピエンコーダ(725)を含む。
【0078】
インターエンコーダ(730)は、現在ブロック(例えば、処理ブロック)のサンプルを受け取り、そのブロックを参照ピクチャ内の1つ以上の参照ブロック(例えば、前のピクチャ及び後のピクチャ内のブロック)と比較し、インター予測情報(例えば、インター符号化技術に従う冗長情報の記述、動きベクトル、マージモード情報)を生成し、何らかの適切な技術を用いてインター予測情報に基づいてインター予測結果(例えば、予測されたブロック)を計算するよう構成される。いくつかの例において、参照ピクチャは、符号化されたビデオ情報に基づいて復号されている復号された参照ピクチャである。
【0079】
イントラエンコーダ(722)は、現在ブロック(例えば、処理ブロック)のサンプルを受け取り、いくつかの場合には、同じピクチャ内で既にコーディングされたブロックとそのブロックを比較し、変換後の量子化された係数を、更には、いくつかの場合には、イントラ予測情報(例えば、1つ以上のイントラ符号化技術に従うイントラ予測方向情報)も生成するよう構成される。例において、イントラエンコーダ(722)はまた、イントラ予測情報及び同じピクチャ内の参照ブロックに基づいてイントラ予測結果(例えば、予測ブロック)を計算する。
【0080】
汎用コントローラ(721)は、汎用制御データを決定し、汎用制御データに基づいてビデオエンコーダ(703)の他のコンポーネントを制御するよう構成される。例において、汎用コントローラ(721)は、ブロックのモードを決定し、モードに基づいて制御信号をスイッチ(726)へ供給する。例えば、モードがイントラモードである場合には、汎用コントローラ(721)は、残差計算部(723)による使用のためにイントラモード結果を選択するようスイッチ(726)を制御し、そして、イントラ予測情報を選択し、イントラ予測情報をビットストリームに含めるようエントロピエンコーダ(725)を制御する。モードがインターモードである場合には、汎用コントローラ(721)は、残差計算部(723)による使用のためにインター予測結果を選択するようスイッチ(726)を制御し、そして、インター予測情報を選択し、インター予測情報をビットストリームに含めるようエントロピエンコーダ(725)を制御する。
【0081】
残差計算部(723)は、受け取られたブロックと、イントラエンコーダ(722)又はインターエンコーダ(730)から選択された予測結果との間の差(残差データ)を計算するよう構成される。残差エンコーダ(724)は、残差データを符号化して変換係数を生成するために残差データに基づき動作するよう構成される。例において、残差エンコーダ(724)は、残差データを空間領域から周波数領域に変換し、変換係数を生成するよう構成される。次いで、変換係数は、量子化された変換係数を取得するよう量子化処理を受ける。様々な実施形態において、ビデオエンコーダ(703)はまた、残差デコーダ(728)も含む。残差デコーダ(728)は、逆変換を実行し、復号された残差データを生成するよう構成される。復号された残差データは、イントラエンコーダ(722)及びインターエンコーダ(730)によって適切に使用され得る。例えば、インターエンコーダ(730)は、復号された残差データ及びインター予測情報に基づいて、復号ブロックを生成することができ、イントラエンコーダ(722)は、復号された残差データ及びイントラ予測情報に基づいて、復号されたブロックを生成することができる。復号されたブロックは、復号されたピクチャを生成するよう適切に処理され、復号されたピクチャは、メモリ回路(図示せず。)にバッファリングされ、いくつかの例では参照ピクチャとして使用され得る。
【0082】
エントロピエンコーダ(725)は、符号化されたブロックを含めるようにビットストリームをフォーマット化するよう構成される。エントロピエンコーダ(725)は、HEVC標準規格などの適切な標準規格に従って様々な情報を含めるよう構成される。例において、エントロピエンコーダ(725)は、汎用制御データ、選択された予測情報(例えば、イントラ予測情報又はインター予測情報)、残差情報、及び他の適切な情報をビットストリームに含めるよう構成される。開示されている対象に従って、インターモード又は双予測モードのどちらか一方のマージサブモードでブロックをコーディングする場合に、残差情報は存在しない点に留意されたい。
【0083】
図8は、開示の他の実施形態に従うビデオデコーダ(810)の図を示す。ビデオデコーダ(810)は、コーディングされたビデオシーケンスの部分であるコーディングされたピクチャを受け取り、コーディングされたピクチャを復号して、再構成されたピクチャを生成するよう構成される。例において、ビデオデコーダ(810)は、
図4の例のビデオデコーダ(410)の代わりに使用される。
【0084】
図8の例では、ビデオデコーダ(810)は、
図8に示されるように結合されているエントロピデコーダ(871)、インターデコーダ(880)、残差デコーダ(873)、再構成モジュール(874)、及びイントラデコーダ(872)を含む。
【0085】
エントロピデコーダ(871)は、コーディングされたピクチャから、シンタックス要素を表す特定のシンボルを再構成するよう構成され得、それらから、コーディングされたピクチャは構成されている。かようなシンボルは、例えば、ブロックがコーディングされるモード(例えば、イントラモード、又はマージサブモード若しくは他のサブモードにおけるインターモード若しくは双予測モード)、イントラデコーダ(872)又はインターデコーダ(880)による予測のために夫々使用される特定のサンプル又はメタデータを識別することができる予測情報(例えば、イントラ予測情報又はインター予測情報)、例えば、量子化された変換係数の形をとる残差情報、などを含むことができる。例において、予測モードがインター又は双予測モードである場合には、インター予測情報がインターデコーダ(880)へ供給され、予測タイプがイントラ予測タイプである場合には、イントラ予測情報がイントラデコーダ(872)へ供給される。残差情報は、逆量子化を受けることができ、残差デコーダ(873)へ供給される。
【0086】
インターデコーダ(880)は、インター予測情報を受け取り、インター予測情報に基づいてインター予測結果を生成するよう構成される。
【0087】
イントラデコーダ(872)は、イントラ予測情報を受け取り、イントラ予測情報に基づいて予測結果を生成するよう構成される。
【0088】
残差デコーダ(873)は、逆量子化された変換係数を取り出すように逆量子化を実行し、逆量子化された変換係数を処理して、残差を周波数領域から空間領域に変換するよう構成される。残差デコーダ(873)はまた、(量子化パラメータ(QP)を含めるための)特定の制御情報を要求してもよく、その情報は、エントロピデコーダ(871)によって供給されてよい(これは低容量の制御情報のみであるということで、データパスは示されない。)。
【0089】
再構成モジュール(874)は、残差デコーダ(873)によって出力された残差と、(場合によっては、インター又はイントラ予測モジュールによって出力された)予測結果とを空間領域において組み合わせて、再構成されたブロックを形成するよう構成される。再構成されたブロックは、再構成されたピクチャの部分であってよく、次いで、再構成されたピクチャは、再構成されたビデオの部分であってよい。なお、デブロッキング動作などのような他の適切な動作が、視覚品質を改善するために実行されてもよい。
【0090】
なお、ビデオエンコーダ(403)、(603)及び(703)並びにビデオデコーダ(410)、(510)及び(810)は、如何なる適切な技術によっても実装可能である。実施形態において、ビデオエンコーダ(403)、(603)及び(703)並びにビデオデコーダ(410)、(510)及び(810)は、1つ以上の集積回路を用いて実装可能である。他の実施形態では、ビデオエンコーダ(403)、(603)及び(703)並びにビデオデコーダ(410)、(510)及び(810)は、ソフトウェア命令を実行する1つ以上のプロセッサを用いて実装可能である。
【0091】
本開示の態様は、コーディングされたビデオストリームに制約フラグを含むコーディングツール及び機能の制御技術を提供する。
【0092】
本開示の態様に従って、ビットストリーム内のピクチャサイズは、同じままであることができ、あるいは、変化してもよい。いくつかの関連例では、ビデオエンコーダ及びデコーダは、コーディングされたビデオシーケンス(Coded Video Sequence,CVS)、グループ・オブ・ピクチャ(Groupe Of Picture,GOP)、又は類似したマルチピクチャ時間フレームのために定義されて一定のままである所与のピクチャサイズに対して作用することができる。一例では、MPEG-2などで、システム設計は、シーンのアクティビティなどの因子に応じて水平解像度(よってピクチャサイズ)を変更することが知られているが、Iピクチャでのみ、従って、ピクチャサイズは、通常はGOPのために定義されて一定のままである。CVS内の異なる解像度の使用のための参照ピクチャのリサンプリングは、例えばITU-T推奨H.263付録Pから、知られている。しかし、CVSでのピクチャサイズは変化せず、参照ピクチャのみがリサンプリングされ、その結果、ピクチャキャンバスの部分のみが使用されること(例えば、ダウンサンプリングの場合)や、シーンの部分のみが捕捉されること(アップサンプリングの場合)が起こる可能性がある。いくつかの例で、H.263付録Qなどでは、各次元(例えば、上方向又は下方向)において2倍で個々のマクロブロックをリサンプリングすることが許されている。しかし、ピクチャサイズは同じままである。マクロブロックのサイズが固定され得るとき、例えば、H.263では、マクロブロックのサイズは通知される必要がない。
【0093】
いくつかの関連例では、予測されたピクチャでのピクチャサイズは変化することができる。VP9などの例では、ピクチャ全体の参照ピクチャリサンプリング及び解像度変更が許されている。いくつかの例(例えば、Hendry, et. al,“On adaptive resolution change (ARC) for VVC”,Joint Video Team document JVET-M0135-v1,2019年1月9日;その全文を本願に援用される。)では、異なる解像度(例えば、より高い解像度又はより低い解像度)への参照ピクチャ全体のリサンプリングが許されている。異なる候補解像度は、シーケンスパラメータセット(Sequence Parameter Set,SPS)でコーディングすることができ、ピクチャパラメータセット(Picture Parameter Set,PPS)内のピクチャごとのシンタックス要素によって参照され得る。
【0094】
本開示の態様に従って、ソースビデオは、異なる解像度などの異なる品質を持った1つ以上のレイヤを含むビットストリームにピクチャを符号化することができるレイヤードコーディングによって圧縮可能である。ビットストリームは、どのレイヤ(又はレイヤの組)がデコーダ側で出力され得るかを指定するシンタックス要素を有することができる。出力されるレイヤの組は、出力レイヤセットとして定義され得る。例えば、複数のレイヤ及びスケーラビリティをサポートするビデオコーデックにおいて、1つ以上の出力レイヤセットはビデオパラメータセット(VPS)で通知され得る。ビットストリーム全体又は1つ以上の出力レイヤセットのプロファイル・ティア・レベル(Profile Tier Level,PTL)を指定するシンタックス要素は、VPS、いくつかの例ではデコーダ能力情報(Decode Capability Information,DCI)と呼ばれることがあるデコーダパラメータセット(Decoder Parameter Set,DPS)、SPS、PPS、SEIメッセージ、などで通知され得る。PTL情報には、コーディングツール又は機能に関して制約を指定することができる一般制約情報が存在することができる。様々なコーディングツール及び機能について制約情報を効率的に表現及び通知することが望ましい。
【0095】
いくつかの例において、「サブピクチャ」という用語は、例えば、意味的にグループにまとめられて、変更された分解能で独立してコーディングされ得るサンプル、ブロック、マクロブロック、コーディングユニット、又は同様のエンティティの長方形配置を指すために使用され得る。1つ以上のサブピクチャはピクチャを形成することができる。1つ以上のコーディングされたサブピクチャは、コーディングされたピクチャを形成することができる。1つ以上のサブピクチャは、ピクチャに組み立てられ得、また、1つ以上のサブピクチャはピクチャから抽出され得る。いくつかの例では、1つ以上のコーディングされたサブピクチャは、サンプルレベルへのトランスコーディングを伴わない圧縮された領域で、コーディングされたピクチャに組み立てられ得る。いくつかの例では、1つ以上のコーディングされたサブピクチャは、圧縮された領域で、コーディングされたピクチャから抽出され得る。
【0096】
いくつかの例では、例えば、参照ピクチャリサンプリングによる、CVS内のピクチャ又はサブピクチャの解像度の変更を許すメカニズムは、適応解像度変更(Adaptive Resolution Change,ARC)と呼ばれ得る。適応解像度変更を実行するために使用される制御情報はARCパラメータと呼ばれ得る。ARCパラメータは、フィルタパラメータ、スケーリング係数、出力及び/又は参照ピクチャの解像度、様々な制御フラグ、及び/又はその他を含むことができる。
【0097】
いくつかの例では、ARCの符号化/復号化はピクチャの単位であり、よって、制御情報(ARCパラメータ)の組が、信号及び意味的に独立したコーディングされたビデオピクチャの符号化/復号化のために使用される。いくつかの例では、ARCの符号化/復号化はサブピクチャの単位であり、よって、ピクチャ内の複数のサブピクチャは、独立したARCパラメータで符号化/復号化され得る。ARCパラメータは様々な技術で通知することができる、ことが留意されるべきである。
【0098】
図9は、本開示のいくつかの実施形態に係るARCパラメータのシグナリング技術の例(例えば、オプション)を示す。コーディング効率、複雑性、及びアーキテクチャは例ごとに様々であることができる。ビデオコーディング標準規格又は技術は、ARCパラメータのシグナリングのために、1つ以上の例又は他の変形を選択してよい。例は、相互排他的でなくてもよく、アプリケーションニーズ、標準技術、エンコーダの選択、及び/又はその他に基づき交換されてもよい。
【0099】
本開示の態様に従って、ARCパラメータは、様々な方法で、ARCパラメータのクラスとして供給されてよい。いくつかの例では、ARCパラメータのクラスには、X次元及びY次元で別々の又は組み合わされたアップサンプル及び/又はダウンサンプル係数が含まれる。一例では、アップサンプル及び/又はダウンサンプル係数を含むテーブルを指すことができる1つ以上の短いシンタックス要素がコーディングされ得る。
【0100】
いくつかの例では、ARCパラメータのクラスはアップサンプル及び/又はダウンサンプル係数を含み、所与の数のピクチャに対する一定速度のズームイン及び/又はアウトを示す時間次元が加えられる。一例では、時間次元が追加されたアップサンプル及び/又はダウンサンプル係数を含むテーブルを指すことができる1つ以上の短いシンタックス要素がコーディングされ得る。
【0101】
いくつかの例では、ARCパラメータのクラスは、組み合わせて又は別々に入力ピクチャ、出力ピクチャ、参照ピクチャ、コーディングされたピクチャの、サンプル、ブロック、マクロブロック、CU、又はその他の適切な粒度でのX次元又はY次元の解像度を含む。いくつかの例では、ビデオコーディングで使用される1つよりも多い解像度(例えば、入力ピクチャのための1つの解像度、参照ピクチャのための他の解像度)が存在し、値の組(解像度の1つに対応する。)は値の他の組(解像度の他の1つに対応する。)から推測され得る。値の決定は、例えば、フラグの使用に基づき、ゲーティングされ得る。ゲーティングのためのフラグの利用については、以降の説明で詳述される。
【0102】
いくつかの例では、ARCパラメータのクラスは、上述されたように適切な粒度で、H.263付録Pで使用されるものに類似するワーピング座標を含む。H.263付録Pは、ワーピング座標をコーディングするための効率的な方法を定義している。他の効率的な方法を考案することができる。例えば、付録Pのワーピング座標の可変長可逆ハフマンスタイルコーディングは、適切な長さのバイナリコーディングで置換することができ、この場合、バイナリコードワードは、最大画像サイズの境界外でのワーピングを可能にするように、最大画像サイズに係数を掛けて値をオフセットすることで求められ得る。
【0103】
いくつかの例では、ARCパラメータのクラスは、アップサンプル及び/又はダウンサンプルフィルタパラメータを含む。一例では、アップサンプリング及び/又はダウンサンプリングのために単一のフィルタしか存在しない。他の例では、複数のフィルタが使用され得る。いくつかの例では、フィルタパラメータが、フィルタ設計をより柔軟にする用に通知され得る。フィルタパラメータは、可能なフィルタ設計のリストの中から、インデックスを使用することによって選択することができる。フィルタは、(例えば、適切なエントロピコーディング技術を使用して、フィルタ係数のリストを指定することによって)完全に指定されても、フィルタは、上記のメカニズムのいずれかに従って通知されるアップサンプル及び/又はダウンサンプル比により暗黙的に選択されても、かつ/あるいは、別なふうに指定/選択されてもよい。
【0104】
以下の記載では、アップサンプル及び/又はダウンサンプル係数の有限な組(X次元及びY次元の両方で使用される同じ係数)が、コードワードによるARCパラメータのシグナリングを説明するために使用される。いくつかの例では、コードワードは、例えば、ビデオコーディング規格(例えば、H.264及びH.265)において特定のシンタックス要素にExt-Golombコードを用いて、可変長コーディングされ得る。
【0105】
図10は、アップサンプル又はダウンサンプル係数、コードワード、及びExt-Golombコードのマッピングについてのテーブル(1000)の例を示す。
【0106】
他の類似したテーブルが、ビデオ圧縮技術又は標準規格で利用可能なアップスケール及びダウンスケールメカニズムの適用及び能力に従って導出され得る、ことが留意されるべきである。いくつかの例では、テーブル1は、追加の値に適切に拡張され得る。値は、例えば、バイナリコーディングを使用することによって、Ext-Golombコード以外のエントロピコーディングメカニズムによって表されてもよい、ことが留意されるべきである。一例では、Ext-Golombコード以外のエントロピコーディングメカニズムは、リサンプリング係数が、例えば、メディア認識ネットワーク要素(Media-Aware Network Element(s),MANE)にとって、ビデオ処理エンジン(例えば、エンコーダ及びデコーダ)の外部で重要である場合に、特定の利点があり得る。いくつかの例では、解像度変更が不要である場合に(例えば、元の/目標の解像度がテーブル1中で1である。)、短いExt-Golombコード(例えば、テーブル1に示される単一ビットのみ)が選択され得る。これは、例えば、最も一般的なケースでバイナリコードを使用するよりも、コーディング効率の利点があり得る。
【0107】
本開示の態様に従って、テーブル1などのマッピングテーブルが構成可能である。例えば、テーブル1中のエントリの数及び対応するセマンティクスは完全に又は部分的に構成可能である。いくつかの例では、マッピングテーブルの基本アウトラインは、SPS又はDPSなどの高位パラメータセットで運ばれる。代替的に、又は追加的に、いくつかの例では、テーブル1に類似した1つ以上のテーブルがビデオコーディング技術又は標準規格で定義されてもよく、テーブルの1つは、例えば、SPS又はDPSにより、選択されてよい。
【0108】
上述されたようにコーディングされるアップサンプル又はダウンサンプル係数などのARC情報がビデオコーディング技術又は標準規格シンタックスに含まれてもよい。1つ以上のコードワードが、アップサンプル又はダウンサンプル係数などのARC情報の他のクラスを制御するために使用され得る、ことが留意されるべきである。いくつかの例では、非常に大量のデータが、フィルタ又は他のデータ構造に必要とされる。
【0109】
図9を参照すると、H.263付録Pなどの例(910)において、ARC情報(912)は、4つのワーピング座標の形をとることができ、H.263 PLUSPTYPE(913)ヘッダ拡張などのピクチャヘッダに含まれる。例(910)は、i)ピクチャヘッダが利用であり、ii)ARC情報の頻繁な変更が予想されるときに、適用され得る。しかし、例えば例(910)に示されるような、H.263-スタイルシグナリングを使用するときにオーバーヘッドは高くなる可能性があり、スケーリング係数は、ピクチャヘッダが一時的な性質の者であり得るために、ピクチャ境界の間で適用できない可能性がある。
【0110】
図9を参照すると、JVCET-M135-v1などの例(920)では、ARC参照情報(925)(例えば、インデックス)がPPS(924)に置かれ、目標の解像度(例えば、解像度1~3)を含むテーブル(つまり、目標解像度テーブル)(926)を指すことができる。一例では、テーブル(926)はSPS(927)に位置する。SPS(927)内のテーブル(926)に目標解像度を置くことは、能力交換中の相互運用性ネゴシエーションポイントとしてSPSを使用することによって正当化され得る。解像度は、適切なPPS(924)内の参照(例えば、ARC参照情報(925))によってピクチャごとにテーブル(926)内の値の限られた組(例えば、解像度1~3)の中で変化し得る。
【0111】
図9は、ビデオビットストリームでARC情報を運ぶために使用され得る例(930)、(940)及び(950)などの追加技術も示す。技術は、同じビデオコーディング技術又は標準規格において、個別的に使用されてもよく、あるいは、適切な組み合わせで使用することができる。
【0112】
図9を参照すると、例(930)において、リサンプリング係数(又はズーム係数)などのARC情報(939)は、スライスヘッダ、GOBヘッダ、タイルヘッダ、タイルグループヘッダ、などのヘッダに存在してよい。例えば、
図9では、タイルグループヘッダ(938)が表されている。例(930)によって表されている技術は、ARC情報(939)が、数ビットの固定長コードワード又は単一の可変長ue(v)などの少数のビットデコーディングされ得る場合に、使用することができる。
【0113】
本開示の態様に従って、ヘッダ(例えば、
図9のタイルグループヘッダ(938)、スライスヘッダ、又はタイルヘッダ)で直接にARC情報(939)を有することは、ARC情報(939)が、ピクチャ全体ではなく、例えば、対応するタイルグループ(又はスライス、タイル)によって表示されるサブピクチャに適用可能である点で、更なる利点を有することができる。更に、一例では、たとえビデオ圧縮技術又は標準規格がピクチャ全体の適応解像度の変更しか想定していないとしても(例えば、タイル
グループに基づく適応解像度の変更とは対照的に)、例(930)は、誤り耐性の視点から、例(910)と比べて特定の利点を有することができる。
【0114】
図9を参照すると、例(940)において、ARC情報(942)は、PPS、ヘッダパラメータセット、タイルパラメータセット、適応パラメータセット(Adaptation Parameter Set,APS)などのようなパラメータセット(941)に存在してよい。例えば、
図9では、APS(941)が表されている。いくつかの例で、パラメータセット(941)の範囲は、ピクチャよりも大きくなくてもよく、例えば、ピクチャ、タイルグループなどであることができる。ARC情報(例えば、ARC情報(942))の使用は、関連するパラメータセット(例えば、APS(941))の活性化により暗示的であることができる。例えば、ビデオコーディング技術又は標準規格がピクチャベースのARCしか企図していない場合に、PPC又は同等物が適切であり得る。
【0115】
図9を参照すると、例(950)において、ARC参照情報(953)は、上述されたように、タイルグループヘッダ(954)又は類似したデータ構造(例えば、ピクチャヘッダ、スライスヘッダ、タイルヘッダ、又はGOPヘッダ)に存在してよい。
図9では、タイルグループヘッダ(954)が一例として表されている。ARC参照情報(953)は、単一のピクチャを超えた範囲を有するパラメータセット(956)、例えば、SPS、DPS、などで利用可能なARC情報のサブセット(955)を参照することができる。
図9では、SPS(956)が一例として表されている。
【0116】
図11は、本開示のいくつかの実施形態に係るARCパラメータシグナリングのいくつかの例を示す。
図11は、ビデオコーディング標準規格で使用されるシンタックスダイアグラム例を示す。一例では、シンタックスダイアグラムの表記は、C型プログラミングにほぼ従う。太字体の行は、ビットストリームに存在するシンタックス要素を示すことができ、太字体ではない行は、制御フロー又は変数の設定を示すことができる。
【0117】
図11を参照すると、タイルグループヘッダ(1101)は、ピクチャの一部(例えば、長方形部分)に適用可能なヘッダのシンタックス構造を含む。一例では、タイルグループヘッダ(1101)は、可変長の、Ext-Golombコーディングされたシンタックス要素dec_pic_size_idx(1102)(太字体で表記)を条件付きで含むことができる。タイルグループヘッダ(1101)でのシンタックス要素(例えば、dec_pic_size_idx(1102))の存在は、例えば、フラグ(例えば、adaptive_pic_resolution_change_flag)(1103)によって表現される適応解像度に基づき、ゲーティングされ得る。フラグ(例えば、adaptive_pic_resolution_change_flag)(1103)の値は太字体で表されておらず、よって、フラグは、フラグがシンタックスダイアグラムで現れるポイントでビットストリームに存在する。適応解像度がピクチャ又はピクチャの部分に使用中であるかどうかは、ビットストリームの中又は外で高位シンタックス構造(例えば、
図11のSPS(1110))で通知され得る。
【0118】
図11を参照ると、SPS(1110)の抜粋が示されている。SPS(1110)は、フラグ(1111)(例えば、adaptive_pic_resolution_change_flag)である第1シンタックス要素(1111)を含む。フラグ(1111)が真であるとき、フラグ(1111)は、特定の制御情報を必要とし得る適応解像度の使用を示すことができる。一例では、特定の制御情報は、SPS(1110)及びタイルグループヘッダ(1101)においてif()文によって示されるように、フラグ(1111)の値に基づき条件付きで存在する。
【0119】
図11の例で示されるように、適応解像度が使用中であるとき、サンプルの単位での出力解像度(又は出力ピクチャの解像度)(1113)はコーディングされる。一例では、出力解像度(1113)は、幅分解能(例えば、output_pic_width_in_luma_samples)及び高さ分解能(例えば、output_pic_height_in_luma_samples)に基づきコーディングされる。ビデオコーディング技術又は標準規格では、出力解像度(1113)の値への特定の制限が定義される場合がある。例えば、レベル定義は、全部の出力サンプルの数を制限し得る(例えば、output_pic_width_in_luma_samplesとoutput_pic_height_in_luma_samplesとの積)。いくつかの例では、ビデオコーディング技術又は標準規格、あるいは、外部技術又は標準規格(例えば、システム標準)は、幅分解能及び/又は高さ分解能の番号付け範囲(例えば、幅分解能及び/又は高さ分解能は、2の累乗で割り切れる。)、高さ分解能に対する幅分解能のアスペクト比(例えば、高さ分解能に対する幅分解能の比は4:3又は16:9である。)、などを制限することができる。一例では、上記の制限は、ハードウェア実施を容易にするために導入されてもよい。
【0120】
特定のアプリケーションでは、エンコーダは、サイズが出力ピクチャサイズであると暗黙的に仮定するのではなく、特定の参照ピクチャサイズを使用するようにデコーダに命じることができる。例えば、シンタックス要素(例えば、reference_pic_size_present_flag)(1114)は、参照ピクチャ次元(1115)の条件付きの存在をゲーティングする。参照ピクチャ次元(1115)は、一例では、幅(例えば、reference_pic_width_in_luma_samples)及び高さ(例えば、reference_pic_hight_in_luma_samples)の両方を含むことができる。
【0121】
また
図11では、適用可能な復号化ピクチャ幅及び高さのテーブルが表されている。一例では、テーブル内の入力の数は、テーブル指示(例えば、シンタックス要素num_dec_pic_size_in_luma_samples_minus1)(1116)によって表現され得る。「minus1」は、シンタックス要素(1116)の値の解釈を参照することができる。例えば、コーディングされた値がゼロである場合に、1つのテーブル入力が存在する。コーディングされた値が5である場合に、6つのテーブル入力が存在する。テーブル内の入力ごとに、復号されたピクチャ幅及び高さがシンタックス要素(1117)として含まれる。
【0122】
シンタックス要素(1117)によって表されるテーブル入力は、タイルグループヘッダ(1101)内のシンタックス要素dec_pic_size_idx(1102)を用いてインデックス付けすることができるので、タイルグループごとに異なる復号化サイズ及びズーム係数を可能にする。
【0123】
本開示の態様に従って、特定のビデオコーディング技術又は標準規格(例えば、VP9)は、時間スケーラビリティと併せて、特定の形式の参照ピクチャリサンプリングを実施することによって空間スケーラビリティを可能にすることができる。実施形態において、参照ピクチャは、空間エンハンスメントレイヤのベースを形成するよう、より高い解像度へとARCスタイル技術を用いてアップサンプリングされる。アップサンプリングされたピクチャは、通常の予測メカニズム(例えば、参照ピクチャからのインター予測のための動き補償予測)を使用して、例えば詳細を追加するために高解像度で精緻化され得る。
【0124】
いくつかの例では、ネットワーク抽象化レイヤ(Network Abstraction Layer,NAL)ユニットヘッダ内の値、例えば、時間IDフィールドは、時間レイヤ情報とともに空間レイヤ情報も示すために使用される。時間レイヤ情報及び空間レイヤ情報の両方を示すためにNALユニットヘッダ内の値を使用することは、変更なしでスケーラブル環境に対して既存の選択された転送ユニット(Selected Forwarding Units,SFU)の使用を可能にすることができる。例えば、既存のSFUは、NALユニットヘッダの時間ID値に基づき、選択された時間レイヤの転送用に作成及び最適化され得る。次いで、既存のSFUは、いくつかの例では変更なしで空間スケーラビリティ(例えば、空間レイヤの選択)のために使用することができる。いくつかの例では、コーディングされたピクチャと、NALユニットヘッダの時間ID値内の時間IDフィールドによって示される時間レイヤとの間に、マッピングが与えられ得る。
【0125】
本開示の態様に従って、コーディングされたビットストリームのいくつかの特徴は、プロファイル、ティア、レベル、及び一般制約情報を含むプロファイル、ティア、及びレベルの組み合わせ(PTL)情報を用いて指定され得る。いくつかの例では、プロファイルは、色再現、解像度、追加のビデオ圧縮、などのようなビットストリームの特徴のサブセットを定義する。ビデオコーデックは、ベースライン(baseline)プロファイル(例えば、低圧縮比率による簡単なプロファイル)、ハイ(high)プロファイル(高圧縮比率による複雑なプロファイル)、メイン(main)プロファイル(例えば、ベースラインプロファイルとハイプロファイルとの間の中間圧縮比率によるプロファイルはデフォルトのプロファイル設定であることができる。)、などのような様々なプロファイルを定義することができる。
【0126】
更に、ティア及びレベルは、最大ビットレート、最大ルーマサンプルレート、最大ルーマピクチャサイズ、最小圧縮比、許されるスライスの最大数、許されるタイルの最大数、などに関してビットストリームを定義する特定の制約を指定するために使用され得る。より低いティアは、より高いティアよりも制約が多く、より低いレベルは、より高いレベルよりも制約が多い。一例では、標準規格は2つのティア:メイン(Main)及びハイ(High)を定義してよい。MainティアはHighティアよりも低いティアである。ティアは、それらの最大ビットレートに関して異なっているアプリケーションを扱うよう作られる。Mainティアは、ほとんどのアプリケーションのために設計され、一方、Highティアは、一例では、非常に要求の厳しいアプリケーションのために設計される。標準規格は複数のレベルを定義することができるレベルは、ビットストリームのための制約の組である。一例では、レベル4よりも下のレベルについては、Mainティアのみが許される。いくつかの例では、所与のティア/レベルに従うデコーダは、そのティア/レベル及びより低い全てのティア/レベルについて符号化されている全てのビットストリームを復号することができることを求められる。
【0127】
一般制約情報には、ビデオソースタイプ、コーディングツール及び機能に関する制約情報が含まれ得る。例えば、制約フラグは、インターコーディングツール、イントラコーディングツール、DBF、エントロピコーディング、変換、パーティショニング(例えば、タイル、スライス)、バッファ管理、ランダムアクセス(例えば、IDR)、パラメータセット(例えば、SPS、PPS)、及び/又は同様のものがコーディングされたビデオビットストリームに存在しているか又は使用されているかどうかを示すことができる。制約情報は、パラメータセット(例えば、SPS、VPS、又はDCI)で通知することができる。制約フラグは、高位シンタックス構造(例えば、SPS、VPS、DCI)で通知することができる。
【0128】
本開示のいくつかの実施形態に従って、PTL情報は範囲(例えば、ビットストリーム内のコーディングされたビデオデータの部分)に関連することができる。いくつかの例では、PTL情報は、例えば、ビットストリーム全体、ビットストリームのCVS、ビットストリームの各出力レイヤセット(OLS)、及び/又は同様のものに対して規定され得、VPS、DPS、DCI、SPS、PPS、APS、GOP、シーケンス、ヘッダ、SEIメッセージ、などのような高位シンタックス(High-Level Syntax,HLS)構造で通知することができる。
【0129】
いくつかの例では、高位シンタックス(HLS)は、ブロックレベルに関して定義される。ブロックレベルのコーディングツールは、ピクチャ内のピクセル又はサンプルを復号してピクチャを再構成するために使用することができる。ブロックレベルのコーディングツールは、インター予測用のコーディングツール(つまり、インターコーディングツール)、イントラ予測用のコーディングツール(つまり、イントラコーディングツール)、適応ループフィルタ(ALF)、デブロッキングフィルタ(DeBlocking Filter,DBF)、エントロピコーディング、変換、などのような、コーディングブロックの再構成に使用される如何なる適切なコーディングツールも含むことができる。
【0130】
高位シンタックス(HLS)は、ツール及びバッファ制御の機能、システムインターフェース、ピクチャレベルの制御、などに関する情報を規定することができる。例えば、HLSは、パーティション(例えば、タイル、スライス、サブピクチャ)、バッファ管理、ランダムアクセス(例えば、IDR、クリーンランダムアクセス(Clean Random Access,CRA))、パラメータセット(例えば、VPS、SPS、PPS、APS)、参照ピクチャリサンプリング(Reference Picture Resampling(PRP))、スケーラビリティ、及び/又は同様のものを規定することができる。高位レベルシンタックスは、ブロックレベルよりも上であることができる。
【0131】
制御情報は、SPSレベルのツール制御情報、PPSレベルのツール制御情報、シーケンスレベルの制御情報、ビットストリームレベルの制御情報、及び/又は同様のものなどの適切なレベルを有することができる。いくつかの例では、PTL情報は、制御情報の部分であり、HLS構造で制約フラグとして通知することができ、HLS構造に対応する範囲においてツールの制御又は制約を示すことができる。例えば、PTL情報用の制約フラグは、シーケンスレベルの制御情報及びビットストリームレベルの制御情報のうちの1つで供給され得る。一例では、特定のツールがHLS構造で制約フラグによって無効にされる場合には、ツールは、例えば、HLSに対応する範囲でブロックをコーディングするためには、使用されない。
【0132】
図12及び
図13は、本開示のいくつかの実施形態に係るPTL情報の例を示す。
図12は、PTLシンタックス要素の組のシンタックス構造例(1200)を示し、
図12は、一般制約情報のシンタックス構造例(1300)を示す。
【0133】
図12で、PTLシンタックス要素の組は、general_profile_idc、general_tier_flag、general_level_idc、num_sub_profiles、general_sub_profile_idc、sublayer_level_present_flag、ptl_alignment_zero_bit、及びsublayer_level_idcを含むことができる。
【0134】
図13で、一般制約情報は複数の制約フラグを含むことができる。一例では、1に等しい制約フラグ(例えば、intra_only_constraint_flag)は、パラメータsh_slice_typeがI(すなわち、イントラスライスであるスライス)であるべきことを示す。パラメータsh_slice_typeは、タイプIとPとBとの間でスライスのコーディングタイプを規定するスライスヘッダ内のパラメータである。0に等しい制約フラグ(例えば、intra_only_constraint_flag)(1305)は、PTL情報の範囲内の全てのコーディングされたピクチャに対して制約(例えば、sh_slice_typeはIでなければならない。)を課さず、このとき、他の情報(例えば、profile_idc)は非イントラスライスを許すことができる。他の例では、1に等しい制約フラグ(例えば、no_alf_contraint_flag)(1306)は、sps_alf_enabled_flagがPTL情報の範囲内の全てのCVSに対して0に等しいことを示すことができ、よって、適応ループフィルタリングは、たとえ適応ループフィルタリングが、例えば、profile_idcに基づき、許されるとしても、使用されない。0に等しい制約フラグ(例えば、no-alf_contraint_flag)(1306)は、上記の制約を課さない。
【0135】
他の例では、制約フラグ(例えば、no_lossless_coding_tool_contraint_flag)(1301)は、
図13に示されるように、汎用制約情報で通知することができる。1に等しい制約フラグ(例えば、no_lossless_coding_tool_contraint_flag)(1301)は、可逆コーディングに関係があるコーディングツールが、制約フラグ(1301)を含むPTL情報の範囲内で使用不可であることを示すことができる。0に等しい制約フラグ(例えば、no_lossless_coding_tool_contraint_flag)(1301)は、上記の制約を課さない。
【0136】
他の例では、制約フラグ(例えば、no_lossy_coding_tool_constraint_flag)(1302)は、
図13に示されるように、汎用制約情報で通知することができる。1に等しい制約フラグ(例えば、no_lossy_coding_tool_constraint_flag)(1302)は、不可逆コーディングに関係があるコーディングツールが、制約フラグ(1302)を含むPTL情報の範囲内で使用不可であることを示すことができる。0に等しい制約フラグ(例えば、no_lossy_coding_tool_constraint_flag)(1302)は、上記の制約を課さない。
【0137】
実施形態において、制約フラグ(例えば、no_lossless_coding_tool_contraint_flag)(1301)は、制約フラグ(例えば、no_lossy_coding_tool_constraint_flag)(1302)が1に等しいときに1に等しくなくてもよい。代替的に、制約フラグ(例えば、no_lossy_coding_tool_constraint_flag)(1302)が、制約フラグ(例えば、no_lossless_coding_tool_contraint_flag)(1301)が1に等しいときには1に等しくなくてもよい。
【0138】
汎用制約情報内の複数の制約フラグは、特定の順序でソートされ得る。順序は、例えば、各々のメカニズム及び/又はツールがPTLの範囲において使用されない可能性に基づき、セットされ得る。順序は優先順序と呼ばれ得る。順序は、汎用制約情報シンタックス構造において高い優先度から低い優先度まで与えられ得、このとき、高い優先度は、ツール(又はメカニズム)の不使用は尤度が高いことを示し、低い優先度は、ツール(又はメカニズムの不使用)の不使用は尤度が低いことを示す。順序に影響を及ぼす付加的に因子には、ツールが特定の使用ケースにのみ使用される可能性が高いこと(例えば、サブピクチャ、スケーラビリティ、及び/又はインターレースサポート)、エンコーダ/デコーダ/実施複雑性に対するツールの影響、などが含まれ得る。
【0139】
図14A~14Bは、本開示のいくつかの実施形態に係る、PTLシンタックス構造(PTLブラケットとも呼ばれる。)のシンタックス構造例(1410)及び汎用制約情報シンタックス構造(汎用制約情報ブラケットとも呼ばれる。)のシンタックス構造例(1420)を含むPTL情報の例を示す。いくつかの例では、制約フラグの数を示すシンタックス要素(例えば、num_available_contraint_flag)が通知され得る。一例では、制約フラグの数を示すシンタックス要素は、例えば、汎用制約情報ブラケットのシンタックス例(1420)の外にあることができる
図14Aに示されたシンタックス例(1410)内の(1401)によって示されるような、PTLシンタックス構造で通知することができる。代替的に、制約フラグの数を示すシンタックス要素は、シンタックス要素(1420)の最初などの、汎用制約情報ブラケットの最初に通知することができる。シンタックス要素(例えば、num_available_contraint_flag)が存在し、シンタックス要素の数(例えば、num_available_contraint_flag)がNに等しい場合に、最初のN個の制約フラグは汎用制約情報シンタックス構造に存在してよい。更に、他の制約フラグは、存在しなくてもよく、特定の値に等しいと推測され得る。Nは非負整数であることができる。
【0140】
実施形態において、値N(例えば、num_available_contraint_flag)は、0から制約フラグの最大数(例えば、パラメータMaxNumConstraintFlags)までの範囲内にある。制約フラグの最大数は任意の正整数であることができる。制約フラグの最大数(例えば、MaxNumConstraintFlags)の値は、16、32、64、128、などであるよう予め定義され得る。値N(例えば、num_available_contraint_flag)が0に等しい場合に、制約フラグは汎用制約情報シンタックス構造に存在しない。値N(例えば、num_available_contraint_flag)のコーディングは、値N及び制約フラグの対応するエントロピコーディング表現がバイトアライメントを確かにするよう8で割りきれる数まで合計され得るように、選択され得る。
【0141】
いくつかの例では、制約フラグは、1つ以上の制約情報グループに分類され得る。各制約情報グループは、1つ以上の制約フラグを含むことができ、対応するゲートフラグを有することができる。対応する制約情報グループのゲートフラグは、対応する制約情報グループ内の制約フラグが存在する可能性があるかどうかを示すことができる。一例では、ゲートフラグは、制約グループ存在フラグと呼ばれ得る。一般に、ゲートフラグは、対応する制約情報グループに関連し、対応する制約情報グループ内の制約フラグに関連する。実施形態において、ゲートフラグは、対応する制約情報グループ内の制約フラグが制約情報に存在する(又は通知される)かどうかをゲーティングする。例えば、対応する制約情報グループのゲートフラグが1に等しい場合に、制約情報グループに対応する制約フラグは、例えば、汎用制約情報において、存在することができる。対応する制約情報グループのゲートフラグが0に等しい場合には、制約情報グループに対応する制約フラグは、例えば、汎用制約情報において、存在しなくてもよい。一例では、全てのゲートフラグが0に等しい場合に、制約フラグは存在しない。
【0142】
制約フラグは異なる範囲を有することができる。例えば、DCI内の制約フラグの範囲は、コーディングされたビデオビットストリームであることができる。VPS内の制約フラグの範囲は、複数のレイヤを有するCLVSであることができる。SPS内の制約フラグの範囲は、単一CLVSであることができる。
【0143】
図15A~15Bは、本開示の実施形態に係る汎用制約情報シンタックス構造(1500)の一例を示す。汎用制約情報シンタックス構造(1500)は、汎用制約情報を表すフラグを含む。具体的に、汎用制約情報シンタックス構造(1500)は、
図15Aのゲートフラグ(例えば、general_frame_structure_constraint_group_flag)(1501)、ゲートフラグ(例えば、high_level_functionality_contraint_group_flag)(1502)、ゲートフラグ(例えば、scalability_constraint_group_flag)(1503)、ゲートフラグ(例えば、partitioning_constraint_group_flag)(1504)、ゲートフラグ(例えば、intra_coding_tool_constraint_group_flag)(1505)、ゲートフラグ(例えば、inter_coding_tool_constraint_group_flag)(1506)、ゲートフラグ(例えば、transform_constraint_group_flag)(1507)、ゲートフラグ(例えば、inloop_filtering_constraint_group_flag)(1508)などのような1つ以上のゲートフラグを含む。1つ以上のゲートフラグ(例えば、ゲートフラグ(1501)~(1508))は、
図15Aに示されるように、汎用制約情報シンタックス構造(1500)の最初に存在することができる。
【0144】
ゲートフラグ(例えば、general_frame_structure_constraint_group_flag)(1501)は、制約情報グループ(1510)に関連し、制約情報グループ(1510)内にある制約フラグ(1511)~(1514)に関連する。1に等しいゲートフラグ(例えば、general_frame_structure_constraint_group_flag)(1501)は、制約情報グループ(1510)内にある制約フラグ(1511)~(1514)が存在してもよいことを規定することができる。
【0145】
制約情報グループ(1510)(又は制約フラグ(1511)~(1514))は、入力ソース及びフレームパッキング(例えば、パッキング又は投影されたフレーム)に関係があることができる。
図15Aを参照すると、制約フラグ(1511)~(1514)は、general_non_packed_constraint_flag(1511)、general_frame_only_constraint_flag(1512)、general_non_projected_constraint_flag(1513)、及びgeneral_one_picture_only_constraint_flag(1514)に対応する。さもなければ、0に等しいゲートフラグ(例えば、general_frame_structure_constraint_group_flag)(1501)は、制約情報グループ(1510)内にある制約フラグ(1511)~(1514)が汎用制約情報シンタックス構造(1500)に存在しなくてもよいことを規定することができる。
【0146】
更に、いくつかの例では、1に等しいゲートフラグ(例えば、high_level_functionality_contraint_group_flag)(1502)は、制約情報グループ(1520)内にある高位機能(例えば、参照ピクチャリサンプリング)に関する制約フラグが
図15Bによって示されるように存在してもよいことを規定することができる。さもなければ、0に等しいゲートフラグ(例えば、high_level_functionality_contraint_group_flag)(1502)は、制約情報グループ(1520)内にある制約フラグが汎用制約情報シンタックス構造(1500)に存在しなくてもよいことを規定することができる。
【0147】
図15Aを参照し直すと、1に等しいゲートフラグ(例えば、scalability_constraint_group_flag)(1503)は、スケーラビリティ(例えば、インターレイヤ予測)に関する制約フラグが存在してもよいことを規定することができる。さもなければ、スケーラビリティに関する制約フラグは、汎用制約情報シンタックス構造(1500)に存在しなくてもよい。
【0148】
1に等しいゲートフラグ(例えば、partitioning_constraint_group_flag)(1504)は、高位パーティショニング(例えば、サブピクチャ又はタイル)に関する制約フラグが存在してもよいことを規定することができる。さもなければ、高位パーティショニングに関する制約フラグは、汎用制約情報シンタックス構造(1500)に存在しなくてもよい。
【0149】
1に等しいゲートフラグ(例えば、intra_coding_tool_constraint_group_flag)(1505)は、イントラコーディング(例えば、イントラ予測)に関する制約フラグが存在してもよいことを規定することができる。さもなければ、イントラコーディングに関する制約フラグは、汎用制約情報シンタックス構造(1500)に存在しなくてもよい。
【0150】
1に等しいゲートフラグ(例えば、inter_coding_tool_constraint_group_flag)(1506)は、インターコーディング(例えば、インターピクチャ予測のための動き補償)に関する制約フラグが存在してもよいことを規定することができる。さもなければ、インターコーディングに関する制約フラグは、汎用制約情報シンタックス構造(1500)に存在しなくてもよい。
【0151】
1に等しいゲートフラグ(例えば、transform_constraint_group_flag)(1507)は、変換コーディング(例えば、多重変換行列)に関する制約フラグが存在してもよいことを規定することができる。さもなければ、変換コーディングに関する制約フラグは、汎用制約情報シンタックス構造(1500)に存在しなくてもよい。
【0152】
実施形態において、全てのゲートフラグ(例えば、
図15Aのゲートフラグ(1501)~(1508))が0に等しい場合に、制約フラグは汎用制約情報シンタックス構造(例えば、汎用制約情報シンタックス構造(1500))に存在しない。
【0153】
本開示の態様に従って、シンタックスは、ゲートフラグ(例えば、ゲートフラグ(1501)~(1508))、関連する制約フラグ(例えば、制約フラグ(1511)~(1512)及び制約情報グループ(1520)内の制約フラグ)、追加制御情報、及び/又は同様のものを含む制御情報がバイトアライメントされ得るように設計することができ、例えば、フラグの数は、バイトアライメントを保つために8で割りきれる。一例では、制約情報(例えば、汎用制約情報シンタックス構造(1500))内のゲートフラグ及び制約フラグの数は8で割りきれる。バイトアライメントメカニズムは、制御情報のバイトアライメントを達成するために使用され得る。
図15Bを参照すると、シンタックス(例えば、whileループ)(1530)がバイトアライメントのために使用され得る。
【0154】
いくつかの実施形態で、オフセット(例えば、シンタックス要素constraint_info_offset[]を使用する。)などのオフセット情報、及び長さ(例えば、シンタックス要素constraint_info_length[])などの長さ情報が、制約情報内のゲートフラグに関連した各々の制約情報グループで制約フラグを示すのを助けるよう、制約情報に(例えば、汎用制約情報シンタックス構造の最初に)存在する。実施形態において、少なくとも1つの制約情報グループのうちの1つ以上は、コーディングされたビデオビットストリームに存在する。制約情報グループの場合に、オフセット及び長さは、制約情報グループのための制約情報に存在することができる。オフセットは、制約情報グループ内の第1制約フラグへのオフセットを示すことができ、長さは、制約情報グループ内の制約フラグの数を示すことができる。いくつかの例で、制約情報グループの数は、例えば、シンタックス要素num_constraint_info_setによって、明示的に指示することができる。num_constraint_info_setの値は、0以上の整数であることができる。num_constraint_info_setの値が0であるとき、constraint_info_offset[]、constraint_info_length[]、及び制約フラグは汎用制約情報シンタックス構造に存在しない。
【0155】
実施形態において、制約情報オフセット(例えば、シンタックス要素constraint_info_offset[i])及び制約情報長さ(例えば、シンタックス要素constraint_info_length[i])は、制約情報(例えば、汎用制約情報シンタックス構造)で制約情報グループi(iは正整数である。)のための制約フラグを示すのを助けることができる。一例では、制約情報オフセット(例えば、シンタックス要素constraint_info_offset[i])の値が5に等しく、制約情報長さ(例えば、シンタックス要素constraint_info_length[i])の値が3に等しいとき、5番目、6番目及び7番目の制約フラグが制約情報グループiに関連し、制約情報(例えば、汎用制約情報シンタックス構造)に存在する。
【0156】
一例では、ランレングス(run-length)コーディングが、所定の順序(又は所与の順序)で規定される制約フラグをコーディングするために使用され得る。
【0157】
実施形態において、ランコーディング(run-coding)が使用されてもよく、このとき、制約フラグは所定の順序(又は所与の順序)で規定される。制約フラグを直接コーディングする代わりに、“スキップ”値の適切にコーディングされたリストが、ゼロに等しい制約フラグを示すことができ、続く制約フラグは1に等しいことが暗示される。上記のランコーディングは、(i)制約フラグの数が多く、(ii)制約フラグのごく一部が1に等しい場合に特に有効であり得る。
【0158】
実施形態において、少なくとも1つの制約情報グループのうちの1つ以上は、コーディングされたビデオビットストリームに存在する。少なくとも1つの制約情報グループのうちの1つ以上における複数の制約フラグは、所定の順序に従って通知される。従って、複数の制約フラグはランコーディング(例えば、ラン符号化又はラン復号化)され得る。更に、コーディングブロックのサブセットのための予測情報が複数の制約フラグに基づき決定され得る。
【0159】
実施形態において、ゲートフラグの制約情報グループ内の少なくとも1つの制約フラグは、所定の順序に従って通知された複数の制約フラグを含む。従って、複数の制約フラグはランコーディング(例えば、ラン符号化又はラン復号化)され得る。
【0160】
実施形態において、制約フラグの全リストは、ビデオコーディング標準規格(例えば、VVC仕様)、外部テーブル、などで規定され得る。一例では、制約フラグの利用可能な制約フラグのみが、例えば、次の:利用可能な制約フラグの数(例えば、num_available_contraint_flags)、ゲートフラグ(又は制約グループ存在フラグ)、制約情報オフセット情報及び制約情報長さ情報、などのうちの1つ以上によって示され、コーディングされたビデオストリームに存在する。
【0161】
一例では、制約フラグの全リストが規定され、エンコーダ及びデコーダに利用可能である。制約フラグの全リストはデコーダに記憶され得る。制約フラグの全リストは100個の制約フラグを含むことができる。100個の制約フラグのうちの10個は、CLVSのための制約情報に存在し、よって、CLVS内のコーディングブロックのサブセットに利用可能である。100個の制約フラグのうちの10個は、10個の利用可能な制約フラグと呼ばれる。一例では、利用可能な制約フラグの数(例えば、10)が通知される。一例では、10個の利用可能な制約フラグは2つの制約情報グループにあり、第1ゲートフラグ及び第2ゲートフラグによってゲーティングされる。よって、第1ゲートフラグ及び第2ゲートフラグは、10個の利用可能な制約フラグを示すよう通知され得る。
【0162】
一例では、第1制約情報オフセット(例えば、シンタックス要素constraint_info_offset[0])及び第1制約情報長さ(例えば、シンタックス要素constraint_info_length[0])が通知される。第2制約情報オフセット(例えば、シンタックス要素constraint_info_offset[1])及び第2制約情報長さ(例えば、シンタックス要素constraint_info_length[1])が通知される。例えば、シンタックス要素constraint_info_offset[0]は15であり、シンタックス要素constraint_info_length[0]は3であり、シンタックス要素constraint_info_offset[1]は82であり、シンタックス要素constraint_info_length[1]は7であり、よって、全リスト(例えば、100個の制約フラグ)内の15番目から17番目の制約フラグ及び82番目から88番目の制約フラグが利用可能であり、あるいは、制約情報に存在する。
【0163】
実施形態において、制約フラグの効率的なコーディングのための様々な技術(又は方法、実施形態、例)のいずれも、適切な制御情報を使用して、組み合わされ得る。組み合わせは、そのような技術のうちの2つ以上の適切な組み合わせであってよい。代替的に、様々な技術(又は方法、実施形態、例)のうちの1つは独立して使用することができる。制約情報はグループにまとめられ得る。特定のグループでは、ランコーディングが使用され得、一方、他のグループは単純なバイナリコーディングを用いてもよい。
【0164】
制約フラグの最大数(例えば、MaxNumConstraintFlags)の値は、16、32、64、128などであるよう予め定義され得る。
【0165】
制約フラグの最大数(例えば、MaxNumConstraintFlags)の値は、general_profile_idc若しくはgeneral_sub_profile_idcなどのプロファイル情報、又はコーデックバージョン情報によって決定することができ、それにより、制約フラグの数(例えば、num_available_contraint_flags(1401))の範囲がプロファイル情報又はバージョン情報によって制限され得る。例えば、メインプロファイル内の制約フラグの数(例えば、num_available_contraint_flags(1401))の値(なお、MaxNumConstraintFlags=64)は、0から64の範囲にあることができ、一方、高度(advanced)プロファイル内の制約フラグの数(例えば、num_available_contraint_flags(1401))の値(なお、MaxNumConstraintFlags=128)は、0から128の範囲にあることができる。
【0166】
実施形態において、制約フラグの数(例えば、num_available_contraint_flags)の値は、general_profile_idc若しくはgeneral_sub_profile_idcなどのプロファイル情報、又はコーデックバージョン情報によって予め定義された値に等しいと推測することができるので、num_available_contraint_flagsの値は明示的なシグナリングなしで決定可能である。
【0167】
いくつかの実施形態において、予約済み(reserved)バイト情報が汎用制約情報シンタックス構造に存在することができる。例えば、
図13に示されるように、フラグgci_num_reserved_bytes(1303)及びgci_reserved_bytes[](1304)が、汎用制約情報シンタックス構造の拡張のために、汎用制約情報シンタックス構造に存在することができる。フラグgci_num_reserved_bytesは予約済み制約バイトの数を規定することができる。一例では、予約済み制約バイトは追加フラグ(例えば、追加制約フラグ)用である。フラグgci_reserved_bytes[]は如何なる適切な値も有してよい。
【0168】
実施形態において、gci_reserved_bytesの値は、general_profile_idc若しくはgeneral_sub_profile_idcなどのプロファイル情報、又はコーデックバージョン情報によって制限又は決定されてよい。基本プロファイル(又はメインプロファイル)によれば、フラグgci_reserved_bytesの値は0であることができる。拡張プロファイル(又は高度プロファイル)によれば、gci_num_reserved_bytesの値は0よりも大きくなる。
【0169】
いくつかの実施形態において、フィールドシーケンスフラグは、コーディングされたビデオビットストリームで通知することができる。フィールドシーケンスフラグは、出力レイヤセット内のピクチャがフィールドコーディングでコーディングされているかどうかを示すことができる。いくつかの例では、フィールドシーケンスフラグは、シンタックス要素sps_field_seq_flagを用いてSPSで通知することができる。実施形態において、フラグsps_field_seq_flagはSPSに存在する。1に等しいフラグsps_field_seq_flagは、フィールドを表すピクチャをCLVSが運ぶことを示すことができる。0に等しいフラグsps_field_seq_flagは、フレームを表すピクチャをCLVSが運ぶことを示すことができる。
【0170】
図13の汎用制約情報シンタックス構造には、フラグgeneral_frame_only_constraint_flagが存在してよい。1に等しいフラグgeneral_frame_only_constraint_flagは、出力レイヤセット用の範囲(例えば、OlsInScope)が、フレームを表すピクチャを運ぶことを規定することができる。0に等しいフラグgeneral_frame_only_constraint_flagは、出力レイヤセット用の範囲(例えば、OlsInScope)が、フレームを表しても表さなくてもよいピクチャを運ぶことを規定する。実施形態において、フラグ、general_frame_only_constraint_flagは、出力レイヤセット内のピクチャがフィールドコーディングでコーディングされているかどうかを示す。出力レイヤセットは、コーディングブロックのサブセットを含むことができる。フラグsps_field_seq_flagは、ピクチャのサブセットがフィールドコーディングでコーディングされていないことを示すフラグgeneral_frame_only_constraint_flag(例えば、1である)に基づき、偽であることができる。ピクチャのサブセットは、出力レイヤセットの1レイヤにあることができる。
【0171】
フラグgeneral_frame_only_constraint_flagが1に等しいとき、フラグsps_field_seq_flagの値は0に等しくてよい。
【0172】
実施形態において、フラグpps_mixed_nalu_types_in_pic_flagはPPSに存在してよい。1に等しいフラグpps_mixed_nalu_types_in_pic_flagは、PPSを参照する各ピクチャが1つよりも多いVCL NALユニットを有し、VCL NALユニットが同じ値のnal_unit_typeを有さないことを規定することができる。0に等しいフラグpps_mixed_nalu_types_in_pic_flagは、PPSを参照する各ピクチャが1つ以上のVCL NALユニットを有し、PPSを参照する各ピクチャのVCL NALユニットが同じ値のnal_unit_typeを有することを規定することができる。
図13の汎用制約情報シンタックス構造には、フラグno_mixed_nalu_types_in_pic_constraint_flagが存在してよい。1に等しいフラグno_mixed_nalu_types_in_pic_constは、pps_mixed_nalu_types_in_pic_flagの値が0に等しくなければならないことを規定することができる。0に等しいフラグno_mixed_nalu_types_in_pic_constは、そのような制約を課さない。
【0173】
実施形態において、フラグgeneral_one_picture_only_constraint_flagは、
図13に示されるように、汎用制約情報シンタックス構造に存在してよい。1に等しいgeneral_one_picture_only_constraint_flagは、コーディングされたピクチャがビットストリームに1つしか存在しないことを規定することができる。0に等しいフラグgeneral_one_picture_only_constraは、そのような制約を課さない。
【0174】
実施形態において、フラグsingle_layer_constraint_flagは、
図13に示されるように、汎用制約情報シンタックス構造に存在してよい。1に等しいフラグsingle_layer_constraint_flagは、sps_video_parameter_set_idが0に等しくなければならないことを規定することができる。0に等しいフラグsingle_layer_constraint_flagは、そのような制約を課さない。フラグgeneral_one_picture_only_constraint_flagが1に等しいとき、フラグsingle_layer_constraint_flagの値は1に等しくてよい。
【0175】
実施形態において、フラグall_layers_independent_constraint_flagは、
図13に示されるように、汎用制約情報シンタックス構造に存在してよい。1に等しいフラグall_layers_independent_constraint_flagは、フラグvps_all_independent_layers_flagが1に等しくてもよいことを規定することができる。0に等しいフラグall_layers_independent_constraint_flagは、そのような制約を課さない。フラグsingle_layer_constraint_flagが1に等しいとき、フラグall_layers_independent_constraint_flagの値は1に等しくてよい。
【0176】
実施形態において、フラグno_res_change_in_clvs_constraint_flagは、
図13に示されるように、汎用制約情報シンタックス構造に存在してよい。1に等しいフラグno_res_change_in_clvs_constraint_flagは、フラグsps_res_change_in_clvs_allowed_flagが0に等しくてもよいことを規定することができる。0に等しいフラグno_res_change_in_clvs_constraint_flagは、そのような制約を課さない。フラグno_ref_pic_resamppling_constraint_flagが1に等しいとき、フラグno_res_change_in_clvs_constraint_flagの値は1に等しくてよい。
【0177】
実施形態において、フラグno_mixed_nalu_types_in_pic_constraint_flagは、
図12の汎用制約情報シンタックス構造に存在してよい。1に等しいフラグno_mixed_nalu_types_in_pic_constraint_flagは、フラグpps_mixed_nalu_types_in_pic_flagの値が0に等しくてもよいことを規定する。0に等しいフラグno_mixed_nalu_types_in_pic_constraint_flagは、そのような制約を課さない。フラグone_subpic_per_pic_constraint_flagが1に等しいとき、フラグno_mixed_nalu_types_in_pic_constraint_flagは1に等しくてよい。
【0178】
実施形態において、フラグno_trail_constraint_flagは、
図13の汎用制約情報シンタックス構造に存在してよい。1に等しいフラグno_trail_constraint_flagは、nuh_unit_typeがTRAIL_NUTに等しいNALユニットがOlsInScopeに存在しなくてもよいことを規定することができる(OlsInScopeは、DPSを参照するビットストリーム全体の全レイヤを含む出力レイヤセットである。)。0に等しいフラグno_trail_constraint_flagは、そのような制約を課さない。フラグgeneral_one_picture_only_constraint_flagが1に等しいとき、フラグno_trail_constraint_flagは1に等しくてよい。
【0179】
実施形態において、フラグno_stsa_constraint_flagは、
図13の汎用制約情報シンタックス構造に存在してよい。1に等しいフラグno_stsa_constraint_flagは、nuh_unit_typeがSTSA_NUTに等しいNALユニットがOlsInScopeに存在しなくてもよいことを規定することができる。0に等しいフラグno_stsa_constraint_flagは、そのような制約を課さない。フラグgeneral_one_picture_only_constraint_flagが1に等しいとき、フラグno_stsa_constraint_flagは1に等しくてよい。
【0180】
実施形態において、フラグno_trail_constraint_flagは、
図13の汎用制約情報シンタックス構造に存在してよい。1に等しいフラグno_trail_constraint_flagは、nuh_unit_typeがTRAIL_NUTに等しいNALユニットがOlsInScopeに存在しなくてもよいことを規定することができる。0に等しいフラグno_trail_constraint_flagは、そのような制約を課さない。フラグgeneral_one_picture_only_constraint_flagが1に等しいとき、フラグno_trail_constraint_flagは1に等しくてよい。
【0181】
実施形態において、フラグno_stsa_constraint_flagは、
図13の汎用制約情報シンタックス構造に存在してよい。1に等しいフラグno_stsa_constraint_flagは、nuh_unit_typeがSTSA_NUTに等しいNALユニットがOlsInScopeに存在しなくてもよいことを規定することができる。0に等しいフラグno_stsa_constraint_flagは、そのような制約を課さない。フラグgeneral_one_picture_only_constraint_flagが1に等しいとき、フラグno_stsa_constraint_flagは1に等しくてよい。
【0182】
実施形態において、フラグno_idr_constraint_flagは、
図13に示されるように、汎用制約情報シンタックス構造に存在してよい。1に等しいno_idr_constraint_flagは、nuh_unit_typeがIDR_W_RADL又はIDR_N_LPに等しいNALユニットがOlsInScopeに存在しなくてもよいことを規定することができる。0に等しいフラグno_idr_constraint_flagはそのような制約を課さない。
【0183】
実施形態において、フラグno_cra_constrraint_flagは、
図13に示されるように、汎用制約情報シンタックス構造に存在してよい。1に等しいフラグno_cra_constrraint_flagは、nuh_unit_typeがCRA_NUTに等しいNALユニットがOlsInScopeに存在しなくてもよいことを規定することができる。0に等しいフラグno_cra_constrraint_flagそのような制約を課さない。
【0184】
実施形態において、フラグno_rasl_constraint_flagは、
図13の汎用制約情報シンタックス構造に存在してよい(フラグno_rasl_constraint_flagは図示されず。)。1に等しいフラグno_rasl_constraint_flagは、nuh_unit_typeがRASL_NUTに等しいNALユニットがOlsInScopeに存在しなくてもよいことを規定することができる。0に等しいフラグno_rasl_constraint_flagはそのような制約を課さない。フラグno_cra_constrraint_flagが1に等しいとき、フラグno_rasl_constraint_flagは1に等しくてよい。
【0185】
実施形態において、フラグno_radl_constraint_flagは、
図13に示されるように、汎用制約情報シンタックス構造に存在してよい。1に等しいフラグno_radl_constraint_flagは、nuh_unit_typeがRADL_NUTに等しいNALユニットがOlsInScopeに存在しなくてもよいことを規定することができる。0に等しいフラグno_radl_constraint_flagはそのような制約を課さない。フラグno_idr_constraint_flagが1に等しく、フラグno_cra_constrraint_flagが1に等しいとき、フラグno_rasl_constraint_flagの値は1に等しくてよい。
【0186】
本開示のいくつかの態様は、変換スキップモードでの残差Riceコーディング、レギュラー残差コーディングでのRiceコーディング、などによる範囲拡張などのような範囲拡張のための制約フラグシグナリングの技術を提供する。
【0187】
変換スキップモードで、変換プロセス及び逆変換プロセスはスキップされる。例えば、ビデオエンコーダで、ピクセル領域残差データは、変換領域へ変換されずに、量子化及びエントロピ符号化されてよい。ビデオデコーダで、符号化されたデータは、逆変換操作なしで、ピクセル領域残差データにエントロピ復号化及び逆量子化される。
【0188】
本開示の態様に従って、残差コーディングはRiceコーディングに基づき実行され得る。Riceコーディングは、入力値を2つの部分に分け、それから異なるコーディング技術を用いて2つの部分をコーディングするために、調整可能なパラメータを使用する。調整可能なパラメータはRiceパラメータと呼ばれる。Riceパラメータは、Riceコーディングのコーディング効率に影響を及ぼす可能性がある。技術は、特定のアプリケーションのためにコーディング効率を改善するようその特定の用途のRiceパラメータを決定するために使用され得る。Riceパラメータを決定するためのいくつかの技術は、ビデオ標準規格の範囲拡張に含まれてもよい。
【0189】
本開示の態様に従って、いくつかの標準規格は、もともとは特定のアプリケーションのために開発され得る。標準規格を他のアプリケーションに適用可能にするために、他のアプリケーションをサポートするツールにより範囲拡張が開発されている。例えば、HEVCは、もともとは、8~10ビット/サンプルでの4:2:0クロマフォーマットによるアプリケーションを対象としている。HEVC標準規格を特定のクロマフォーマット及び特定のビットデプスに加えて他のフォーマット及びビットデプスに適用可能にするために、範囲拡張は、他のクロマフォーマット及び/又はより高いビットデプスを使用するアプリケーションをサポートするよう開発され得る。
【0190】
アプリケーションの特定のグループに必要とされるものに特徴セットを制限するために、ビデオコーディング標準規格は、それらの特徴を使用するエンコーダとの相互運用制のためにサポートされる定義済みのデコーダ特徴セットを含むことができるプロファイルを定義する。プロファイルに加えて、いくつかの標準規格(例えば、VVC、HEVC、など)はレベル及びティアも定義する。レベルは、デコーダ処理負荷及びメモリ能力に対応することがある空間分解能、ピクセルレート、ビットレート値及び変数に関してビットストリームに制限を課す。レベル正弦波、最大サンプルレート、最大ピクチャサイズ、最大ビットレート、最小圧縮比、コーディングされたピクチャバッファの容量、などに関して表され得る。レベルの値が高いほど、複雑さの制限が高くなる可能性がある。ティアは、各レベルごとにビットレートの値及び変動の制限を変更する。例えば、Mainティアはほとんどのアプリケーションを対象としているが、Highティアは、ビデオ配信アプリケーションよりもビットレート値が非常に高いなど、より要求の厳しいビデオコントリビューションアプリケーションに対応するように設計されている。プロファイル、ティア、及びレベルのそれぞれが実装及び復号化の複雑さに影響を与え、3つの組み合わせがビットストリーム及びデコーダの相互運用性ポイントを指定する。
【0191】
いくつかの例では、特定のティア及びレベルに適合しているデコーダは、そのレベル又はそれよりも下の任意のレベルの同じティア又はより低いティアに適合する全てのビットストリームを復号することができることを要求され、特定のプロファイルに適合するデコーダは、そのプロファイルの全ての特徴をサポートすることができる。いくつかの例では、エンコーダは、プロファイルでサポートされている特徴の任意の特定の組を使用することを要求されないが、ビットストリーム、つまり、適合するデコーダによってそれらが復号化されることを可能にする特定の制約に従うビットストリームを生成することを要求される。
【0192】
PTL情報に加えて、PTLシンタックス構造は、ビットストリームの特定の制約特性を示す非フラグシンタックス要素及び制約フラグのリストを含む汎用制約情報(GCI)シンタックス構造も含んでよい。
【0193】
一例では、HEVCは、メインプロファイル、メイン10(Main 10)プロファイル、及びメイン静止画(Main Still Picture)プロファイルと呼ばれる3つのプロファイルをもともと含んでいる。3つのプロファイルは、4:2:0クロマサンプリングのみをサポートすることといった何らかの制限を有している。メインプロファイル及びメイン静止画プロファイルでは、8ビット/サンプルのビデオ精度のみがサポートされ、一方、メイン10プロファイルは最大10ビット/サンプルまでをサポートする。メイン静止画プロファイルでは、ビットストリーム全体が1つのコーディングされたピクチャしか含まない。
【0194】
いくつかの例では、範囲拡張を伴うHEVCは追加のプロファイルをサポートすることができる。一例では、次のプロファイルが範囲拡張プロファイルと総称される:モノクロ(Monochrome)プロファイル、モノクロ10プロファイル、モノクロ12プロファイル、モノクロ16プロファイル、メイン12プロファイル、メイン4:2:2 10プロファイル、メイン4:2:2 12プロファイル、メイン4:4:4プロファイル、メイン4:4:4 10プロファイル、メイン4:4:4 12プロファイル、メインイントラプロファイル、メイン10イントラプロファイル、メイン12イントラプロファイル、メイン4:2:2 10イントラプロファイル、メイン4:2:2 12イントラプロファイル、メイン4:4:4イントラプロファイル、メイン4:4:4 10イントラプロファイル、メイン4:4:4 12イントラプロファイル、メイン4:4:4 16イントラプロファイル、メイン4:4:4静止画プロファイル及びメイン4:4:4 16静止画プロファイル。
【0195】
範囲拡張プロファイルのいくつかは、より高いビットデプスをサポートすることができ、高いビットデプスを有する動作範囲拡張のためのプロファイル(profiles for operation range extensions with high bitdepth)と呼ばれ得る。いくつかの例では、高いビットデプスを有する動作範囲拡張のためのプロファイルは、メイン12プロファイル、メイン12 4:4:4プロファイル、メイン16 4:4:4プロファイル、メイン12イントラプロファイル、メイン12 4:4:4イントラプロファイル、メイン16 4:4:4イントラプロファイル、メイン12静止画プロファイル、メイン12 4:4:4静止画プロファイル、メイン16 4:4:4静止画プロファイル、などのような、10ビット/サンプルよりも大きいものをサポートするプロファイルを含む。
【0196】
具体的に、メイン12プロファイルは、4:0:0及び4:2:0クロマサンプリング、並びにイントラ予測モード及びインター予測モードの両方をサポートして、サンプルあたり8ビットから12ビットのビットデプスを可能にする。いくつかの例では、メイン12プロファイルに適合するデコーダは、次のプロファイル:モノクロ、モノクロ12、メイン、メイン10、及びメイン12で作成されたビットストリームを復号することができる。
【0197】
メイン12 4:4:4プロファイルは、4:0:0、4:2:0、4:2:2及び4:4:4クロマサンプリング、並びにイントラ予測モード及びインター予測モードの両方をサポートして、サンプルあたり8ビットから12ビットのビットデプスを可能にする。いくつかの例では、メイン12 4:4:4プロファイルに適合するデコーダは、次のプロファイル:モノクロ、メイン、メイン10、メイン12、メイン10 4:2:2、メイン12 4:2:2、メイン4:4:4、メイン10 4:4:4、メイン12 4:4:4、及びモノクロ12で作成されたビットストリームを復号することができる。
【0198】
メイン16 4:4:4プロファイルは、4:0:0、4:2:0、4:2:2及び4:4:4クロマサンプリング、並びにイントラ予測モード及びインター予測モードの両方をサポートして、サンプルあたり8ビットから16ビットのビットデプスを可能にする。
【0199】
メイン12イントラプロファイルは、4:0:0及び4:2:0クロマサンプリング、並びにイントラ予測モードをサポートして、サンプルあたり8ビットから12ビットのビットデプスを可能にする。
【0200】
メイン12 4:4:4イントラプロファイルは、4:0:0、4:2:0、4:2:2及び4:4:4、並びにイントラ予測モードをサポートして、サンプルあたり8ビットから12ビットのビットデプスを可能にする。
【0201】
メイン16 4:4:4イントラプロファイルは、4:0:0、4:2:0、4:2:2及び4:4:4、並びにイントラ予測モードをサポートして、サンプルあたり8ビットから16ビットのビットデプスを可能にする。
【0202】
メイン12静止画プロファイルは、4:0:0及び4:2:0クロマサンプリングをサポートして、サンプルあたり8ビットから12ビットのビットデプスを可能にする。メイン12静止画プロファイルでは、ビットストリーム全体が1つのコーディングされたピクチャしか含まない。
【0203】
メイン12 4:4:4静止画プロファイルは、4:0:0、4:2:0、4:2:2及び4:4:4クロマサンプリングをサポートして、サンプルあたり8ビットから12ビットのビットデプスを可能にする。メイン12 4:4:4静止画プロファイルでは、ビットストリーム全体が1つのコーディングされたピクチャしか含まない。
【0204】
メイン16 4:4:4静止画プロファイルは、4:0:0、4:2:0、4:2:2及び4:4:4クロマサンプリングをサポートして、サンプルあたり8ビットから16ビットのビットデプスを可能にする。メイン16 4:4:4静止画プロファイルでは、ビットストリーム全体が1つのコーディングされたピクチャしか含まない。
【0205】
本開示のいくつかの態様に従って、コーディングツール制御は、ビットストリームの範囲、コーディングされたレイヤビデオシーケンス(CLVS)、ピクチャ、ピクチャのスライス、などのような様々な範囲(例えば、コーディングツール制御のためのシンタックス要素のインスタンスの永続性を利用してコーディングされているコーディングされたビデオデータの部分)で実行され得る。いくつかの例では、コーディングツール制御は、デコーダへ出力レイヤセットを運ぶビットストリームに対する制約情報を一般的に含む汎用制約情報(GCI)シンタックス構造で提供することができる。いくつかの例では、コーディングツール制御は、CLVSに関連したシーケンスパラメータセット(SPS)で提供することができ、SPSは、一般的に、CLVSの情報を含む。いくつかの例では、コーディングツール制御はピクチャのピクチャヘッダで提供することができ、ピクチャヘッダは、一般的に、ピクチャの情報を含む。いくつかの例では、コーディングツール制御はスライスのスライスヘッダで提供することができ、スライスヘッダは、一般的に、スライスの情報を含む。
【0206】
本開示の態様に従って、範囲拡張におけるコーディングツールのための制御情報は様々な範囲で提供することができる。いくつかの例では、より広い範囲のシンタックス要素を使用することは、コーディング効率を向上させることができる。例えば、0よりも大きいGCIシンタックス要素値は、ビットストリームが特定の方法で、通常は、特定のコーディングツールがビットストリームで使用されないことを示すよう、制約されることを示す。更に、値0に等しいGCIシンタックス要素値は、関連する制約が適用されない可能性があることを通知し、それにより、関連するコーディングツールは、(その使用が指示されているプロファイルでサポートされる場合に)ビットストリームで使用されることを許される(が要求されない)。
【0207】
本開示の他の態様に従って、コーディングツールがビットストリームでのビデオデータのコーディングで使用されないとき、例えば、PTL情報及び/又は汎用制約情報での、コーディングツールの不使用を示し、コーディングツールのサポートがないビデオデコーダは、PTL情報及び/又は汎用制約情報でのシグナリングに基づき、ビデオデコーダがビットストリームを復号することができることを決定してよく、ビデオデコーダの機能は拡張され得る。
【0208】
いくつかの実施形態において、エンコーダは、範囲拡張を伴うビデオ標準規格に適合するビットストリームを生成することができるが、範囲拡張でサポートされる1つ以上の特徴を使用しない。いくつかの例では、範囲拡張における1つ以上の特徴の不使用を知った上で、ビデオ標準規格に適合するが範囲拡張における1つ以上の特徴をサポートしないデコーダは、デコーダがビットストリームを復号することができることを決定してよく、ビットストリームを拒絶するのではなく、復号化のためにビットストリームを受け入れてよい。
【0209】
図16は、本開示のいくつかの実施形態に係る汎用制約情報のシンタックス構造(1600)を示す。いくつかの例では、シンタックス構造(1600)は、デコーダへの出力レイヤセットを含むビットストリームなどのビットストリームに適用される制約を含む。
図16の例では、シンタックス構造(1600)内でgci_num_additional_bitsによって表されているシンタックス要素が、アライメントゼロビットシンタックス要素(存在する場合)以外の汎用制約情報シンタックス構造(1600)内の追加の汎用制約情報(GCI)ビットの数を指定するために使用される。いくつかの標準規格では、gci_num_additional_bitsの値は、0又は1に等しいことを要求される。いくつかの標準規格では、デコーダは、1よりも大きいgci_num_additional_bitsの値がシンタックス構造に表れることを可能にしてもよい。
【0210】
図16の例では、シンタックス構造(1600)は、
general_no_extended_precision_constraint_flag、
genral_no_ts_residual_coding_rice_present_in_sh_constraint_flag、
general_no_rrc_rice_extension_constraint_flag、
general_no_persistent_rice_adaptation_constraint_flag、及び
general_no_reverse_last_sig_coeff_constraint_flag
によって表される5つの追加のGCIビット(シンタックス要素)(1601)~(1605)を含む。5つの追加のGCIビット(1601)~(1605)は夫々、いくつかの例では、出力レイヤセットのビットストリームの範囲でコーディングツールのコーディング制御情報を提供する。
【0211】
図17は、本開示のいくつかの実施形態に係るシーケンスパラメータセット(SPS)範囲拡張のシンタックス構造(1700)の例を示す。シンタックス構造(1700)は、CLVSに対して範囲拡張のコーディングツールの制御を提供するようCLVSについてはSPSで付加され得る。シンタックス構造(1700)は、
sps_extended_precision_flag、
sps_ts_residual_coding_rice_present_in_sh_flag、
sps_rrc_rice_extension_flag、
sps_persistent_rice_adaptation_enabled_flag、及び
sps_reverse_last_sig_coeff_enabed_flag
によって表される5つのシンタックス要素(1701)~(1705)を含む。5つのシンタックス要素(1701)~(1705)は、いくつかの例では、CLVSの範囲でコーディングツールのコーディング制御情報を提供する。
【0212】
具体的に、実施形態において、GCIビット(1601)及びシンタックス要素(1701)は、異なる範囲において、スケーリング及び変換プロセスでの変換係数や、abs_remainder[]及びdec_abs_level[]などのようないくつかのシンタックス要素の二値化の拡張されたダイナミックレンジのコーディングツールの制御などのような、拡張された精度を使用する制御を提供するために使用される。
【0213】
1に等しいシンタックス要素(1701)は、拡張されたダイナミックレンジが、スケーリング及び変換プロセスでの変換係数のために、並びにabs_remainder[]及びdec_abs_level[]などのようないくつかのシンタックス要素の二値化のために使用されることを規定する。シンタックス要素abs_remainder[走査位置n]は、走査位置nでGolomb-Riceコードによりコーディングされている変換係数レベルの残りの絶対値である。abs_remainder[]が存在しない場合に、それは0に等しいと推測される。シンタックス要素dec_abs_level[走査位置n]は、走査位置nでGolomb-Riceコードによりコーディングされている中間値に対応することができ、走査位置nでの変換係数のレベルを決定するために使用される。0に等しいシンタックス要素(1701)は、拡張されたダイナミックレンジがスケーリング及び変換プロセスで使用されず、例えば、シンタックス要素abs_remainder[]及びdec_abs_level[]などの二値化に使用されないことを規定する。
【0214】
一例では、Log2TransformRangeによって表される変数が、スケーリング及び変換プロセスでの変換係数のために並びに特定のシンタックス要素の二値化のためにダイナミックレンジを決定するために使用される。例えば、変数Log2TransformRangeは、スケーリング及び変換プロセスでの変換係数を表すための並びに特定のシンタックス要素の二値化のためのビットの数であることができる。ダイナミックレンジは、ビットの数を用いて表される、最大数及び最小数の差であることができる。一例では、変数Log2TransformRangeは、式(1):
Log2TransformRange=
sps_extended_precision_flag?
Max(15,Min(20,BitDepth+6)):15 式(1)
を使用することなどの、シンタックス要素(1701)sps_extended_precision_flagに従って、導出される。
【0215】
スケーリング及び変換プロセスでの変換係数のための並びに特定のシンタックス要素の二値化のためのダイナミックレンジは、変数Log2TransformRangeに基づき決定することができる。いくつかの例では、フラグsps_extended_precision_flagが値0を有するとき、拡張されたダイナミックレンジ特徴(例えば、拡張されたダイナミックレンジのコーディングツール)は使用されず、変換係数のダイナミックレンジは、15ビットなどの固定数のビットに基づく。フラグsps_extended_precision_flagが値1を有するとき、拡張されたダイナミックレンジ特徴は有効にされ、スケーリング及び変換プロセスでの変換係数を表すためのビットの数は、式(1)の例におけるビットデプスBitDepthに基づいて、15ビット、16ビット、17ビット、18ビット、19ビット、及び20ビットのうちの1つであることができる。変換係数のダイナミックレンジは、ビットの数に基づき決定され得る。
【0216】
本開示の態様に従って、シンタックス要素(例えば、sps_bitdepth_minus8によって表される。)は、ルーマアレイ及びクロマアレイのサンプルのビットデプス(例えば、BitDepthで表される。)と、ルーマ及びクロマ量子化パラメータ範囲オフセット(例えば、QpBdOffsetで表される。)とを通知するために使用され得る。一例では、ビットデプスBitDepthは、式(2)に従って計算することができ、QP範囲オフセットQpBdOffsetは、式(3)に従って計算することができる:
BitDepth=8+sps_bitdepth_minus8 (2)
QpBdOffset=6×sps_bitdepth_minus8 (3)
【0217】
いくつかの例では、1に等しいGCIビット(1601)は、出力レイヤセットの範囲(OlsInScope)内の全てのピクセルのためのシンタックス要素のインスタンス(1701)が0に等しくてもよいことを規定する。0に等しいGCIビット(1601)はそのような制約を課さない。よって、1に等しいGCIビット(1601)は、ビットストリームのコーディングでの拡張されたダイナミックレンジコーディングツールの不使用を規定することができる。
【0218】
いくつかの実施形態において、GCIビット(1602)及びシンタックス要素(1702)は、異なる範囲において、変換スキップモードでの残差コーディングのためのスライスベースのRiceパラメータ選択などの、変換スキップモードでの残差コーディングのためのスライスベースのRiceコーディングのコーディングツールの制御を提供するために使用される。
【0219】
本開示の態様に従って、変換スキップ残差コーディングのためのスライスベースのRiceパラメータ選択は、ビデオ標準規格の範囲拡張に含まれ得る。いくつかの例では、1つの制御フラグ(例えば、sps_ts_residual_coding_rice_present_in_sh_flagのシンタックス要素(1702)で表される。)は、
図17に示されるように、変換スキップスライスのためのRiceパラメータのシグナリングが有効又は無効にされることを示すよう、変換スキップモードが有効にされる(例えば、シンタックス要素sps_transform_skip_enabled_flagが真である)場合にシーケンスパラメータセット(SPS)で通知される。
【0220】
制御フラグが有効化と通知される(例えば、“1”に等しい)場合に、1つのシンタックス要素(例えば、sh_ts_residual_coding_rice_idx_minus1によって表される。)が更に、変換スキップスライスごとに、例えば、スライスヘッダで通知され、その変換スキップスライスのRiceパラメータの選択を示す。制御フラグが無効化と通知される(例えば、“0”に等しい)場合に、更なるシンタックス要素は、変換スキップスライスのためのRiceパラメータ選択を示すようスライスレベル(例えば、スライスヘッダ)で通知されず、デフォルトのRiceパラメータが、一例でSPSを参照するコーディングされたビデオデータ内の全ての変換スキップスライスに使用されてよい。
【0221】
例えば、SPS内の1に等しいシンタックス要素(1702)は、sh_ts_residual_coding_rice_idx_minus1によって表されるスライスヘッダフラグが、sps_ts_residual_coding_rice_present_in_sj_flagを参照するスライスのスライスヘッダ(例えば、slice_header())シンタックス構造に存在してもよいことを規定する。SPS内の0に等しいシンタックス要素(1702)は、スライスヘッダフラグsh_ts_residual_coding_rice_idx_minus1が、SPSを参照するスライスのslice_header()シンタックス構造に存在しないことを規定する。存在しない場合には、sps_ts_residual_coding_rice_present_in_sh_flagの値は、いくつかの例で、0に等しいと推測される。
【0222】
いくつかの例では、シンタックス要素は、出力レイヤセットの範囲において、変換スキップモードでの残差コーディングのためのスライスベースのRiceコーディングのコーディングツールの使用を制御するよう、汎用制約情報に含まれ得る。例えば、1に等しいシンタックス要素(1602)は、出力レイヤセットの範囲(OlsInScope)内の全てのピクチャのためのシンタックス要素が0に等しくてもよいことを規定する。0に等しいシンタックス要素(1602)はそのような制約を課さない。よって、いくつかの例では、ビットストリーム内の1に等しいGCIビット(1602)は、ビットストリームをコーディングする変換スキップ残差コーディングのためのスライスベースのRiceパラメータ選択の不使用を規定することができる。
【0223】
いくつかの実施形態において、GCIビット(1603)及びシンタックス要素(1703)は、異なる範囲において、レギュラー残差コーディング(Regular Residual Coding,RRC)でのabs_remainder[]及びdec_abs_level[]などのようないくつかのシンタックス要素の二値化のためのRiceパラメータ導出の1つ以上のコーディングツールの制御を提供するために使用される。いくつかの例では、レギュラー残差コーディング(RRC)は、変換及び量子化によって得られたコーディングブロックのためのいくつかの技術を指す。いくつかの例では、RRCは、量子化のみによって得られたブロックのために変更され得る。いくつかの例では、変換スキップ残差コーディング(Transform Skip Residual Coding)は、変換をバイパスして(変換スキップとも呼ばれる。)得られたコーディングツールに専用であるいくつかの技術を指す。
【0224】
いくつかの例では、ビデオコーディング標準規格は、abs_remainder[]及びdec_abs_level[]などのようないくつかのシンタックス要素の二値化のためのRiceパラメータ導出の1つ以上のコーディングツールを含んでよく、ビデオコーディング標準規格の範囲拡張は、abs_remainder[]及びdec_abs_level[]などのようないくつかのシンタックス要素の二値化のためのRiceパラメータ導出の1つ以上の代替コーディングツールを含むことができる。
【0225】
いくつかの例では、ビデオ標準規格は、Riceパラメータ導出のために、ローカルテンプレートに基づいた技術を使用する。例えば、1つ以上(例えば、一例では5つ)の隣接係数レベルを含むテンプレートが、Riceパラメータ導出のために使用される。例えば、テンプレート内の絶対係数値の和が計算され得、次いで、Riceパラメータはその和に基づいて決定される。一例では、ルックアップテーブルが、和に基づいてRiceパラメータを決定するために使用され得る。
【0226】
Riceパラメータは他の適切なコーディングツールによって決定することができる点に留意されたい。一例では、式が、和に基づいてRiceパラメータを決定するために使用され得る。他の例では、コンテキストモデリングが、隣接係数レベルの統計値に基づいてRiceパラメータを決定するために使用され得る。いくつかの例では、ビデオ標準規格の範囲拡張は、Riceパラメータ導出のための1つ以上の代替コーディングツールを規定することができる。
【0227】
いくつかの例で、ビデオ標準規格の範囲拡張は、他のシナリオでの使用のためにRRCへの変更を含むことができる。一例では、範囲拡張は、異なるコンテキストモデリングツールと、変換スキップモードでの残差コーディングのための残差信号回転ツールとを含むことができる。
【0228】
いくつかの例では、1に等しいSPS内のシンタックス要素(1703)は、abs_remainder[]及びdec_abs_level[]の二値化のための代替のRiceパラメータ導出(例えば、範囲拡張におけるRiceパラメータ導出のための代替のコーディングツール)が、SPSを参照するCLVSをコーディングするために使用されることを規定する。0に等しいシンタックス要素(1703)は、abs_remainder[]及びdec_abs_level[]の二値化のための代替のRiceパラメータ導出が、SPSを参照するCLVSをコーディングするために使用されないことを規定する。存在しない場合には、シンタックス要素(1703)の値は、0に等しいと推測される。
【0229】
いくつかの例では、1に等しいシンタックス要素(1603)は、出力レイヤセットの範囲(OlsInScope)内の全てのピクチャのためシンタックス要素(1703)が0に等しくてもよいことを規定する。0に等しいシンタックス要素(1603)はそのような制約を課さない。よって、いくつかの例では、1に等しいGCIビット(1603)は、ビットストリームをコーディングするためにabs_remainder[]及びdec_abs_level[]の二値化のための代替のRiceパラメータ導出(例えば、定められた範囲拡張で規定されているRiceパラメータ導出のための代替のコーディングツール)の不使用を規定することができる。
【0230】
いくつかの実施形態において、GCIビット(1604)及びシンタックス要素(1704)は、異なる範囲において、abs_remainder[]及びdec_abs_level[]の二値化のための統計値ベースのRiceパラメータ導出の制御を提供するために使用される。
【0231】
本開示の態様に従って、abs_remainder[]及びdec_abs_level[]の二値化のためのRiceパラメータ導出は、各変換ユニット(TU)の最初に、前のTUから累積された統計値を用いて初期化され得る。いくつかの例では、統計値ベースのRiceパラメータ導出は、ビデオ標準規格の範囲拡張に含まれ得る。
【0232】
いくつかの例では、制御フラグ、例えば、SPSでsps_persistent_rice_adaptation_enabled_flagによって表されるシンタックス要素(1704)は、統計値ベースのRiceパラメータ導出を制御するために使用される。例えば、SPS内の1に等しいシンタックス要素(1704)は、abs_remainder[]及びdec_abs_level[]の二値化のためのRiceパラメータ導出が、各TUからの最初に、前のTUから累積された統計値を用いて初期化されることを規定する。0に等しいシンタックス要素(1704)は、前のTUの状態が現在のTUのRiceパラメータ導出で使用されないことを規定する。存在しない場合には、シンタックス要素(1704)の値は、0に等しいと推測される。
【0233】
更に、実施形態において、1に等しいシンタックス要素(1704)は、出力レイヤセットの範囲(OlsInScope)内の全てのピクチャのためシンタックス要素(1704)が0に等しくてもよいことを規定する。0に等しいシンタックス要素(1704)はそのような制約を課さない。よって、いくつかの例では、1に等しいGCIビット(1604)は、ビットストリームをコーディングするために統計値ベースのRiceパラメータ導出の不使用を規定することができる。
【0234】
いくつかの実施形態において、GCIビット(1605)及びシンタックス要素(1705)は、異なる範囲において、変換係数のエントロピコーディング中に最後の有効な係数の位置をコーディングするために使用される。一例では、最後の有効な係数の位置は、異なるコーディングツールによってコーディングされ得る。例えば、ビデオ標準規格は、LastSignificantCoeffX及びLastSignificantCoeffYによって表される当該位置の2つの座標を使用することによって、最後の有効な係数の位置を決定することができる第1コーディングツールを規定することができ、ビデオ標準規格の範囲拡張は、代替のコーディングツール、例えば、一例では、ゼロアウト(zero-out)変換ブロックの右下隅を参照して最後の有効な係数の相対座標をコーディングすることによって、最後の有効な係数の位置を決定することができる第2コーディングツールなどを規定することができる。
【0235】
いくつかの例では、SPS内の1に等しいシンタックス要素(1705)は、sh_reverse_last_sig_coeff_flagによって表されるスライスヘッダフラグ(スライス範囲)が、SPSを参照するスライスヘッダシンタックス構造(例えば、いくつかの例ではslice_header())に存在することを規定する。SPS内の0に等しいシンタックス要素(1705)は、スライスヘッダフラグsh_reverse_last_sig_coeff_flagが、SPSを参照するスライスヘッダシンタックス構造に存在しないことを規定し、スライスヘッダフラグsh_reverse_last_sig_coeff_flagは、ゼロであると推測され得る。存在しない場合には、シンタックス要素(1705)の値は、0に等しいと推測される。
【0236】
いくつかの例では、スライスのスライスヘッダフラグsh_reverse_last_sig_coeff_flagは、スライスのコーディング中のスケーリング及び変換プロセスの変換係数における最後の有効な係数の位置導出を決定するために使用される。一例では、sh_reverse_last_sig_coeff_flagが1に等しい場合に、最後の有効な係数の位置は、第2コーディングツールなどの、ビデオ標準規格の範囲拡張における代替のコーディングツールによってコーディングされ、そうでない場合には、最後の有効な係数の位置の現在座標は、第1コーディングツールによってコーディングされる。
【0237】
いくつかの例では、1に等しいGCIビット(1605)は、出力レイヤセットの範囲(OlsInScope)内の全てのピクチャのためシンタックス要素(1705)が0に等しくてもよいことを規定する。0に等しいGCIビット(1605)はそのような制約を課さない。よって、1に等しいGCIビット(1605)は、ビットストリームの範囲について最後の有効な係数の位置導出での第2コーディングツールの不使用を規定することができる。
【0238】
図18は、本開示の実施形態に係るプロセス(1800)を説明するフローチャートを示す。プロセス(1800)は、ビデオデコーダで使用され得る。様々な実施形態において、プロセス(1800)は、端末デバイス(310)、(320)、(330)及び(340)の処理回路、ビデオデコーダ(410)の機能を実行する処理回路、ビデオデコーダ(510)の機能を実行する処理回路、などのような、処理回路によって実行される。いくつかの実施形態で、プロセス(1800)は、ソフトウェア命令で実装され、このようにして、処理回路がソフトウェア命令を実行すると、処理回路はプロセス(1800)を実行する。プロセスは(S1801)から始まり、(S1810)へ進む。
【0239】
(S1810)で、ビットストリーム内のコーディングされたビデオデータの第1範囲でのコーディング制御のための第1シンタックス要素(例えば、general_no_ts_residual_coding_rice_present_in_sh_constraint_flag)が決定される。第1シンタックス要素は、変換スキップモードでの残差コーディングのためのスライスベースRiceコーディングのコーディングツールに関連する。いくつかの例では、コーディングツールは、変換スキップモードでの残差コーディングのためのスライスレベルでのRiceパラメータを提供する
【0240】
一例では、第1シンタックス要素は、シンタックス構造内のシンタックス要素(例えば、gci_num_additional_bits)がシンタックス構造内の汎用制約情報のための追加ビットを示すことに応答して、汎用制約情報のシンタックス構造から復号される。
【0241】
いくつかの例では、コーディングツールは、標準規格の範囲拡張において定義される。一例では、ビデオデコーダは、標準規格をサポートし得るが、標準規格の範囲拡張におけるコーディングツールをサポートしなくてもよい。他の例では、ビデオデコーダは、標準規格の範囲拡張をサポートする。
【0242】
(S1820)で、第1シンタックス要素の値が第1値である場合に、プロセスは(S1830)へ進み、そうでない場合には、プロセスは(S1840)へ進む。第1値は、コーディングされたビデオデータの1つ以上の第2範囲(例えば、出力レイヤセット内の1つ以上のCLVS)を含むビットストリーム内のコーディングされたビデオデータの第1範囲のコーディングにおけるコーディングツールの不使用(無効化)を示す。
【0243】
いくつかの例では、第1シンタックス要素は、デコーダで出力された出力レイヤセット内にピクチャのコーディング制御のために一般制約情報内にある。一例では、第1シンタックス要素の第1値は、出力レイヤセット内の各コーディングされたレイヤビデオシーケンス(CLVS)のコーディングでのコーディングツールの不使用を示す。
【0244】
(S1830)で、第1シンタックス要素が第1値であることに応答して、ビットストリーム内のコーディングされたビデオデータの第1範囲が、コーディングツールを呼び出さずに復号される。
【0245】
いくつかの例では、ビットストリーム内のコーディングされたレイヤビデオシーケンス(CLVS)のコーディング制御のための第2シンタックス要素(例えば、sps_ts_residual_coding_rice_present_in_sh_flag)は、CLVSを復号するためにコーディングツールを呼び出さないことを示す値を有するよう制約される。
【0246】
(S1840)で、第1シンタックス要素が第2値であることをに応答して、ビットストリーム内のコーディングされたビデオデータの第2範囲(例えば、コーディングされたレイヤビデオシーケンス(CLVS))のコーディング制御のための第2シンタックス要素(例えば、sps_ts_residual_coding_rice_present_in_sh_flag)の値が、第2範囲でのコーディングされたビデオデータの復号化のために決定される。コーディングされたビデオデータの第2範囲は、次いで、それに応じて復号される。
【0247】
いくつかの例では、第1シンタックス要素が第2値であり、変換スキップモードがコーディングレイヤビデオシーケンス(CLVS)で有効にされることに応答して、第2シンタックス要素の値が決定される。一例では、第2シンタックス要素は、CLVSが参照するシーケンスパラメータセット(SPS)から復号される。第2シンタックス要素の値は、Riceパラメータの選択を示すスライスレベルシンタックス要素の存在/不存在を示す。第2シンタックス要素の値がスライスレベルシンタックス要素の存在を示すことに応答して、一例では、第3シンタックス要素がスライスのスライスヘッダから復号される。第3シンタックス要素は、変換スキップモードでのスライスの残差コーディングのためのRiceパラメータの選択を示す。
【0248】
一例では、第2シンタックス要素は、CLVSのためのシーケンスパラメータセット(SPS)で提示されず、第2シンタックス要素の値は、CLVSでのコーディングツールの不使用又は変換スキップモードでのスライスの残差コーディングのためのRiceパラメータの選択を示すスライスレベルシンタックス要素の不存在を示すために推測される。
【0249】
プロセス(1800)は適切に適応され得る。プロセス(1800)のステップは変更及び/又は省略され得る。追加のステップを加えることもできる。如何なる適切な実施順序も使用することができる。
【0250】
図19は、本開示の実施形態に係るプロセス(1900)を説明するフローチャートを示す。プロセス(1900)はビデオエンコーダで使用され得る。様々な実施形態で、プロセス(1900)は、端末デバイス(310)、(320)、(330)及び(340)の処理回路、ビデオエンコーダ(403)の機能を実行する処理回路、ビデオエンコーダ(603)の機能を実行する処理回路、ビデオエンコーダ(703)の機能を実行する処理回路などのような、処理回路によって実行される。いくつかの実施形態で、プロセス(1900)は、ソフトウェア命令で実装され、このようにして、処理回路がソフトウェア命令を実行すると、処理回路はプロセス(1900)を実行する。プロセスは(S1901)から始まり、(S1910)へ進む。
【0251】
(S1910)で、処理回路は、変換スキップモードでの残差コーディングのためのスライスベースRiceコーディングのコーディングツールが、ビットストリーム内のコーディングされたビデオデータの第1範囲(例えば、出力レイヤセット)の符号化中に使用されるかどうかを決定する。コーディングされたビデオデータの第1範囲は、コーディングされたビデオデータの1つ以上の第2範囲(例えば、CLVS)を含む。いくつかの例では、コーディングツールは、変換スキップモードでの残差コーディングのためにスライスレベルでRiceパラメータを提供する。
【0252】
いくつかの例では、処理回路は、ビットストリーム内のコーディングされたレイヤビデオシーケンス(CLVS)のコーディング制御のための第2シンタックス要素(例えば、sps_ts_residual_coding_rice_present_in_sh_flag)に基づき、コーディングツールが使用されるかどうかを決定することができる。
【0253】
(S1920)で、コーディングツールがコーディングされたビデオデータの第1範囲で使用されない場合に、プロセスは(S1930)へ進み、そうでない場合には、プロセスは(S1940)へ進む。
【0254】
(S1930)で、第1値を有する第1シンタックス要素(例えば、general_no_persistent_rice_adaptation_constraint_flag)がビットストリームにおいて符号化される。第1シンタックス要素は、ビットストリーム内のコーディングされたビデオデータの第1範囲でのコーディング制御のためのものである。第1シンタックス要素は、変換スキップモードでの残差コーディングのためのスライスベースRiceコーディングのコーディングツールに関連する。第1値は、コーディングされたビデオデータの第1範囲のコーディングでのコーディングツールの不使用を示す。
【0255】
一例では、第1シンタックス要素は、汎用制約情報のシンタックス構造において符号化され、シンタックス構造内のシンタックス要素(例えば、gci_num_additional_bits)は、シンタックス構造内の汎用制約情報のための追加ビットを示すよう調整される。
【0256】
(S1940)で、第2値を有する第1シンタックス要素が、ビットストリームにおいて符号化される。いくつかの例では、第1シンタックス要素は、例えば、第2値が第1シンタックス要素のデフォルト値である場合に、ビットストリームにおいて符号化されず、よって、第1シンタックス要素は、存在しない場合に推測することができ、その場合に、(S1940)はスキップされ得る。
【0257】
プロセス(1900)は適切に適応され得る。プロセス(1900)のステップは変更及び/又は省略され得る。追加のステップを加えることもできる。如何なる適切な実施順序も使用することができる。
【0258】
上記の技術(例えば、制約フラグ、適応解像度パラメータ、及び/又は同様のもののシグナリングのための技術)は、コンピュータ可読命令を使用するコンピュータソフトウェアとして実装され、1つ以上のコンピュータ可読媒体に物理的に記憶され得る。例えば、
図20は、開示される対象の特定の実施形態を実装するのに適したコンピュータシステム(2000)を示す。
【0259】
コンピュータソフトウェアは、1つ以上のコンピュータ中央演算処理装置(CPU)、グラフィクス処理ユニット(GPU)などによって、直接に、又は解釈、マイクロコード実行などを通じて、実行することができる命令を含むコードを生成するように、アセンブリ、コンパイル、リンキングなどのメカニズムに従い得る如何なる適切な機械コード又はコンピュータ言語によってもコーディング可能である。
【0260】
命令は、例えば、パーソナルコンピュータ、タブレットコンピュータ、サーバ、スマートフォン、ゲーム機、インターネット・オブ・シングス(Internet of Things)デバイス、などを含む様々なタイプのコンピュータ又はその構成要素で実行可能である。
【0261】
コンピュータシステム(2000)に関して
図20に示されるコンポーネントは、本質的に例示であり、本開示の実施形態を実装するコンピュータソフトウェアの使用又は機能の範囲に関して如何なる限定も示唆することを意図しない。コンポーネントの構成は、コンピュータシステム(2000)の例示的な実施形態において説明される構成要素のうちのいずれか1つ又は組み合わせに関して如何なる依存性も要件も有するものとして解釈されるべきではない。
【0262】
コンピュータシステム(2000)は、特定のヒューマンインターフェース入力デバイスを含んでよい。かようなヒューマンインターフェース入力デバイスは、例えば、触覚入力(例えば、キーストローク、スワイプ、データグロープ動作)、音声入力(例えば、声、拍手)、視覚入力(例えば、ジェスチャ)、嗅覚入力(図示せず。)を通じた一人以上のユーザによる入力に反応してよい。ヒューマンインターフェースデバイスはまた、音声(例えば、発話、音楽、周囲音)、画像(例えば、スキャンされた画像、静止画カメラから取得された写真画像)、映像(例えば、2次元映像、立体視映像を含む3次元映像)などの、人による意識的な入力に必ずしも直接には関係しない特定のメディアを捕捉するためにも使用され得る。
【0263】
入力ヒューマンインターフェースデバイスは、キーボード(2001)、マウス(2002)、トラックパッド(2003)、タッチスクリーン(2010)、データグローブ(図示せず。)、ジョイスティック(2005)、マイク(2006)、スキャナ(2007)、カメラ(2008)(各1つしか表されていない。)のうちの1つ以上を含んでよい。
【0264】
コンピュータシステム(2000)は、特定のヒューマンインターフェース出力デバイスも含んでよい。かようなヒューマンインターフェース出力デバイスは、例えば、触覚出力、音響、光、及び匂い/味を通じて一人以上のユーザの感覚を刺激するものであってよい。かようなヒューマンインターフェース出力デバイスは、触覚出力デバイス(例えば、タッチスクリーン(2010)、データグローブ(図示せず。)、又はジョイスティック(2005)による触覚フィードバック、しかし、入力デバイスとして機能しない触覚フィードバックデバイスも存在し得る。)、音声出力デバイス(例えば、スピーカ(2009)、ヘッドホン(図示せず。))、視覚出力デバイス(例えば、夫々タッチスクリーン入力機能の有無によらず、夫々触覚フィードバック機能の有無によらず、CRTスクリーン、LCDスクリーン、プラズマスクリーン、OLEDスクリーンを含み、それらのうちのいくつかは、立体視出力、仮想現実メガネ(図示せず。)、ホログラフィックディスプレイ及びスモークタンク(図示せず。)などの手段により2次元視覚出力又は3次元よりも多い次元の出力を出力可能なスクリーン(2010))、及びプリンタ(図示せず。)を含んでよい。
【0265】
コンピュータシステム(2000)は、人がアクセス可能な記憶デバイス及びそれらの関連する媒体、例えば、CD/DVD又は同様の媒体(2021)を有するCD/DVD ROM/RW(2020)、サムドライブ(2022)、リムーバブルハードディスク又はソリッドステートドライブ(2023)、レガシー磁気媒体、例えば、テープ及びフロッピー(登録商標)ディスク(図示せず。)、専用のROM/ASIC/PLDベースデバイス、例えば、セキュリティドングル(図示せず。)、なども含むことができる。
【0266】
当業者であれば、目下開示されている対象に関連して使用されている「コンピュータ可読媒体」という用語が、伝送媒体、搬送波、又は他の一時的な信号を含まないことも理解するはずである。
【0267】
コンピュータシステム(2000)は、1つ以上の通信ネットワーク(2055)へのインターフェース(2054)も含むことができる。ネットワークは、例えば、ワイヤレス、ワイヤライン、光であることができる。ネットワークは更に、ローカル、ワイドエリア、メトロポリタン、車両及び工業、実時間、遅延耐性、などであることができる。ネットワークの例には、イーサネット(登録商標)などのローカルエリアネットワーク、ワイヤレスLAN、GSM、3G、4G、5G、LTEなどを含むセルラーネットワーク、ケーブルTV、衛星TV、及び地上放送TVを含むTVワイヤライン又はワイヤレスワイドエリアデジタルネットワーク、CANBusを含む車両及び工場ネットワーク、などがある。特定のネットワークは、一般に、特定の汎用データポート又はペリフェラルバス(2049)(例えば、コンピュータシステム(2000)のUSBポートなど)に取り付けられた外付けネットワークインターフェースアダプタを必要とする。他は、一般に、後述されるようなシステムバスへの取り付け(例えば、PCコンピュータシステムへのイーサネットネットワーク、又はスマートフォンコンピュータシステムへのセルラーネットワークインターフェース)によってコンピュータシステム(2000)のコアに組み込まれる。これらのネットワークのいずれかを使用して、コンピュータシステム(2000)は他のエンティティと通信することができる。そのような通信は、単方向の受信専用(例えば、ブロードキャストTV)又は単方向の送信専用(例えば、特定のCANBusデバイスへのCANBus)であることができ、あるいは、例えば、ローカル若しくはワイドエリアデジタルネットワークを使用して他のコンピュータシステムに対して双方向であることができる。特定のプロトコル又はプロトコルスタックが、上述されたようなネットワーク及びネットワークインターフェースの夫々で使用可能である。
【0268】
上記のヒューマンインターフェースデバイス、人がアクセス可能な記憶デバイス、及びネットワークインターフェースは、コンピュータシステム(2000)のコア(2040)へ取り付けられ得る。
【0269】
コア(2040)は、1つ以上の中央演算処理装置(CPU)(2041)、グラフィクス処理ユニット(GPU)(2042)、フィールドプログラマブルゲートエリア(FPGA)(2043)の形をとる専用のプログラム可能処理ユニット、特定のタスクのためのハードウェアアクセラレータ(2044)、グラフィクスアダプタ(2050)などを含むことができる。これらのデバイスは、リードオンリーメモリ(ROM)(2045)、ランダムアクセスメモリ(RAM)(2046)、内部のユーザアクセス不能ハードドライブなどの内蔵大容量記憶装置、SSD、など(2047)とともに、システムバス(2048)を通じて接続されてよい。いくつかのコンピュータシステムでは、システムバス(2048)は、追加のCPU、GPUなどによる拡張を可能にするように、1つ以上の物理プラグの形でアクセス可能であることができる。コアのシステムバス(2048)へ直接に又はペリフェラルバス(2049)を通じて、周辺機器が取り付けられ得る。一例では、スクリーン(2010)がグラフィクスアダプタ(2050)へ接続され得る。ペリフェラルバスのためのアーキテクチャには、PCI、USBなどがある。
【0270】
CPU(2041)、GPU(2042)、FPGA(2043)、及びアクセラレータ(2044)は、組み合わせて上記のコンピュータコードを構成することができる特定の命令を実行可能である。そのコンピュータコードは、ROM(2045)又はRAM(2046)に記憶され得る。一時データもRAM(2046)に記憶可能であり、一方、永続性データは、例えば、内蔵大容量記憶装置(2047)に記憶可能である。メモリデバイスのいずれかへの高速な格納及び読み出しは、キャッシュメモリの使用により可能になる。キャッシュメモリは、1つ以上のCPU(2041)、GPU(2042)、大容量記憶装置(2047)、ROM(2045)、RAM(2046)などと密接に関連し得る。
【0271】
コンピュータ可読媒体は、様々なコンピュータ実装動作を実行するためのコンピュータコードを有することができる。媒体及びコンピュータコードは、本開示の目的のために特別に設計及び構成されたものであることができ、あるいは、それらは、コンピュータソフトウェア技術で通常の知識を有する者によく知られており利用可能である種類のものであることができる。
【0272】
例として、限定としてではなく、アーキテクチャ(2000)、具体的にはコア(2040)を有するコンピュータシステムは、1つ以上の有形なコンピュータ可読媒体において具現されているソフトウェアを実行するプロセッサ(CPU、GPU、FPGA、アクセラレータ、などを含む。)の結果として機能を提供することができる。かようなコンピュータ可読媒体は、コア内蔵大容量記憶装置(2047)又はROM(2045)などの、非一時的な性質であるコア(2040)の特定の記憶装置に加えて、先に紹介されたユーザアクセス可能な大容量記憶装置に関連した媒体であることができる。本開示の様々な実施形態を実装するソフトウェアは、そのようなデバイスに記憶され、コア(2040)によって実行可能である。コンピュータ可読媒体には、特定のニーズに応じて、1つ以上のメモリデバイス又はチップが含まれ得る。ソフトウェアは、コア(2040)、及び、具体的には、その中のプロセッサ(CPU、GPU、FPGAなどを含む。)に、RAM(2046)に記憶されているデータ構造を定義することと、ソフトウェアによって定義されたプロセスに従ってそのようなデータ構造を変更することとを含め、本明細書で説明されている特定のプロセス又は特定のプロセスの特定の部分を実行させることができる。追加的に、又は代替案として、コンピュータシステムは、本明細書で説明されている特定のプロセス又は特定のプロセスの特定の部分を実行するようにソフトウェアの代わりに又はそれとともに動作することができる、回路内でハードワイヤード又は別なふうに具現されたロジック(例えば、アクセラレータ(2044))の結果として、機能を提供することができる。ソフトウェアへの言及は、必要に応じて、ロジックを包含することができ、その逆も同様である。コンピュータ可読媒体への言及は、必要に応じて、実行のためのソフトウェアを記憶している回路(例えば、集積回路(IC))、実行のためのロジックを具現する回路、又は両方を包含することができる。本開示は、ハードウェア及びソフトウェアの如何なる適切な組み合わせも包含する。
【0273】
付録A:頭字語
JEM:Joint Exploration Model
VVC:Versatile Video Coding
BMS:Benchmark Set
MV:Motion Vector
HEVC:High Efficiency Video Coding
SEI:Supplementary Enhancement Information
VUI:Video Usability Information
GOP:Group of Picture(s)
TU:Transform Unit(s)
PU:Prediction Unit(s)
CTU:Coding Tree Unit(s)
CTB:Coding Tree Block(s)
PB:Prediction Block(s)
HRD:Hypothetical Reference Decoder
SNR:Signal Noise Ratio
CPU:Central Processing Unit(s)
GPU:Graphics Processing Unit(s)
CRT:Cathode Ray Tube
LCD:Liquid-Crystal Display
OLED:Organic Light-Emitting Diode
CD:Compact Disc
DVD:Digital Video Disc
ROM:Read-Only Memory
RAM:Random Access Memory
ASIC:Application-Specific Integrated Circuit
PLD:Programmable Logic Device
LAN:Local Area Network
GSM:Global System for Mobile communications
LTE:Long-Term Evolution
CANBus:Controller Area Network Bus
USB:Universal Serial Bus
PCI:Peripheral Component Interconnect
FPGA:Field Programmable Gate Area(s)
SSD:Solid-State Drive
IC:Integrated Circuit
CU:Coding Unit
【0274】
本開示は、いくつかの例示的な実施形態について記載してきたが、本開示の範囲内にある代替、交換、及び様々な置換均等物が存在する。よって、明らかなように、当業者であれば、たとえ本明細書で明示的に図示又は説明されていないとしても、本開示の原理を具現し、よって、その精神及び範囲の中にある多数のシステム及び方法に想到可能である。