(19)【発行国】日本国特許庁(JP)
(12)【公報種別】公開特許公報(A)
(11)【公開番号】P2024023476
(43)【公開日】2024-02-21
(54)【発明の名称】コーディングされたピクチャ内における復号順を実装する技術
(51)【国際特許分類】
H04N 19/70 20140101AFI20240214BHJP
【FI】
H04N19/70
【審査請求】有
【請求項の数】13
【出願形態】OL
【外国語出願】
(21)【出願番号】P 2023202894
(22)【出願日】2023-11-30
(62)【分割の表示】P 2022537686の分割
【原出願日】2020-12-21
(31)【優先権主張番号】62/953,812
(32)【優先日】2019-12-26
(33)【優先権主張国・地域又は機関】US
(31)【優先権主張番号】62/954,375
(32)【優先日】2019-12-27
(33)【優先権主張国・地域又は機関】US
(71)【出願人】
【識別番号】520477474
【氏名又は名称】バイトダンス インコーポレイテッド
【氏名又は名称原語表記】BYTEDANCE INC.
【住所又は居所原語表記】12655 West Jefferson Boulevard, Sixth Floor, Suite No. 137 Los Angeles, California 90066 United States of America
(74)【代理人】
【識別番号】110002000
【氏名又は名称】弁理士法人栄光事務所
(72)【発明者】
【氏名】ワン イェクイ
(57)【要約】 (修正有)
【課題】映像処理方法を提供する。
【解決手段】方法は、1つ以上のスライスを含む1つ以上のサブピクチャを含む映像と、規則に従った映像のビットストリーム表現との間で変換を行うことを含み、前記ビットストリーム表現は、多数のコーディングされたユニットを含み、前記規則は、サブピクチャ内のコーディングされたユニットの復号順が、前記コーディングされたユニットのレベルスライスインデックス値の昇順であることを規定する。
【選択図】
図5
【特許請求の範囲】
【請求項1】
1つ以上のスライスを含む1つ以上のサブピクチャを含む映像と、規則に従った映像の
ビットストリーム表現との間で変換を行うことを含み、
前記ビットストリーム表現は、多数のコーディングされたユニットを含み、
前記規則は、サブピクチャ内のコーディングされたユニットの復号順が、前記コーディ
ングされたユニットのレベルスライスインデックス値の昇順であることを規定する、
映像処理方法。
【請求項2】
前記コーディングされたユニットは、映像コーディングされた層(VCL)ネットワー
ク抽象化層(NAL)ユニットに対応する、
請求項1に記載の方法。
【請求項3】
前記規則は、スライスモードが矩形スライスモードである場合に適用される、
請求項1に記載の方法。
【請求項4】
サブピクチャレベルのスライスインデックス値は、スライスのスライスアドレスを規定
するスライスヘッダにおけるslice_address構文要素の値である、
請求項1に記載の方法。
【請求項5】
前記ビットストリーム表現がslice_subpic_idパラメータを排除すると
決定されると、slice_subpic_idパラメータの値を推測する、
請求項1~4のいずれかに記載の方法。
【請求項6】
前記slice_subpic_idパラメータは、前記スライスを含む前記サブピク
チャのサブピクチャ識別(ID)を規定する、
請求項5に記載の方法。
【請求項7】
前記決定時に、slice_subpic_idパラメータの値が0に等しいと推測さ
れる、
請求項5に記載の方法。
【請求項8】
前記複数のコーディングされたユニットを含むサブピクチャのサブピクチャID値は、
前記複数のコーディングされたユニットを含むサブピクチャのサブピクチャインデックス
値とともに単調に増加する、
請求項1~7のいずれかに記載の方法。
【請求項9】
第1のスライスNAL(ネットワーク抽象化層)ユニットと第2のスライスNALユニ
ットを含むピクチャ内における前記コーディングされたユニットの復号順は、i)第1の
スライスNALユニットのサブピクチャレベルのスライスインデックス値が第2のスライ
スNALユニットのサブピクチャレベルのスライスインデックス値よりも小さい、又は、
ii)第1のスライスNALユニットのサブピクチャレベルのスライスインデックス値が
第2のスライスNALユニットのサブピクチャレベルのスライスインデックス値に等しく
、かつ、第1のスライスNALユニットのslice_adress構文要素の値が第2
のスライスNALユニットのslice_adress構文要素の値よりも小さい場合、
前記第1のスライスNALユニットが前記第2のスライスNALユニットに先行するよう
に規定される、
請求項5~7のいずれかに記載の方法。
【請求項10】
1つ以上のスライスを含む1つ以上のサブピクチャを含む映像と、
規則に従った映像のビットストリーム表現との間で変換を行うことを含み、
前記ビットストリーム表現は、多数のコーディングされたユニットを含み、
前記規則は、コーディングされたユニットの復号順が、前記コーディングされたユニッ
トを含む前記1つ以上のサブピクチャから、サブピクチャのサブピクチャ関連値の昇順で
あることを規定する、
映像処理方法。
【請求項11】
前記コーディングされたユニットは、映像コーディングされた層(VCL)ネットワー
ク抽象化層(NAL)ユニットに対応する、
請求項10に記載の方法。
【請求項12】
前記規則は、スライスモードが矩形スライスモードである場合に適用される、
請求項10に記載の方法。
【請求項13】
前記サブピクチャ関連値は、前記コーディングされたユニットを含むサブピクチャの識
別(ID)値に対応する、
請求項10に記載の方法。
【請求項14】
前記サブピクチャ関連値は、前記コーディングされたユニットを含むサブピクチャのサ
ブピクチャインデックス値に対応する、
請求項10に記載の方法。
【請求項15】
前記ビットストリーム表現がslice_subpic_idパラメータを排除すると
決定されると、slice_subpic_idパラメータの値を推測する、
請求項10~14のいずれかに記載の方法。
【請求項16】
前記決定時に、slice_subpic_idパラメータの値が0に等しいと推測さ
れる、
請求項15に記載の方法。
【請求項17】
前記コーディングされたユニットを含むサブピクチャのサブピクチャID値は、前記複
数のコーディングされたユニットを含むサブピクチャのサブピクチャインデックス値とと
もに単調に増加する、
請求項10~16のいずれかに記載の方法。
【請求項18】
前記変換は、前記映像を前記ビットストリーム表現に符号化することを含む、
請求項10~16のいずれかに記載の方法。
【請求項19】
前記変換は、前記ビットストリーム表現から前記映像を復号することを含む、
請求項10~16のいずれかに記載の方法。
【請求項20】
請求項1~19のいずれか1項以上に記載の方法を実装するように構成されたプロセッ
サを備える、映像処理装置。
【請求項21】
実行されると、プロセッサに、請求項1から19のいずれか1つ以上に記載の方法を実装
させるプログラムコードを格納するコンピュータ読み取り可能媒体。
【請求項22】
上述した方法のいずれかに従って生成されたコーディングされた表現またはビットスト
リーム表現を記憶する、コンピュータ読み取り可能媒体。
【請求項23】
請求項1~19のいずれか1つ以上に記載の方法を実装するように構成された、ビット
ストリーム表現を記憶するための映像処理装置。
【発明の詳細な説明】
【技術分野】
【0001】
関連出願の相互参照
パリ条約に基づく適用可能な特許法および/または規則に基づいて、本願は、2019
年12月26日出願の米国特許仮出願第62/953812号および2019年12月2
7日出願の米国特許仮出願第62/954375号の優先権および利益を適時に主張する
ことを目的とする。法に基づくすべての目的のために、上記出願の開示全体は、本明細書
の開示の一部として参照により援用される。
【0002】
本明細書は、映像コーディング化技術、システムおよびデバイスに関する。
【背景技術】
【0003】
デジタル映像は、インターネット及び他のデジタル通信ネットワークにおいて最大の帯
域幅の使用量を占めている。映像を受信及び表示することが可能である接続されたユーザ
機器の数が増加するにつれ、デジタル映像の使用に対する帯域幅需要は増大し続けること
が予測される。
【発明の概要】
【0004】
コーディングされたピクチャ内の映像コーディング層(VCL)ネットワーク抽象化層
(NAL)ユニットの復号順を規定することを含む、デジタル映像コーディングに関連す
るデバイス、システム、および方法を説明する。記載された方法は、既存の映像コーディ
ング標準(例えば、高効率映像コーディング(High Efficiency Vid
eo Coding、HEVC)および/または汎用映像コーディング標準(VVC))
および将来の映像コーディング規格、または映像コーデックの両方に適用することができ
る。
【0005】
1つの代表的な態様において、開示される技術は、映像処理の方法を提供するために使
用してもよい。この方法は、1つ以上のスライスを含む1つ以上のサブピクチャを含む映
像と、規則に従った映像のビットストリーム表現との間で変換を行うことを含み、前記ビ
ットストリーム表現は、多数のコーディングされたユニットを含み、前記規則は、サブピ
クチャ内のコーディングされたユニットの復号順が、前記コーディングされたユニットの
レベルスライスインデックス値の昇順であることを規定する。
【0006】
1つの代表的な態様において、開示される技術は、映像処理の方法を提供するために使
用してもよい。この方法は、1つ以上のスライスを含む1つ以上のサブピクチャを含む映
像と、規則に従った映像のビットストリーム表現との間で変換を行うことを含み、前記ビ
ットストリーム表現は、多数のコーディングされたユニットを含み、前記規則は、コーデ
ィングされたユニットの復号順が、前記コードユニットを含む前記1つ以上のサブピクチ
ャから、サブピクチャのサブピクチャ関連値の昇順であることを規定する。
【0007】
別の代表的な態様において、上記方法は、プロセッサが実行可能なコードの形式で実施
され、コンピュータ読み取り可能プログラム媒体に記憶される。
【0008】
さらに別の代表的な態様において、上述した方法を行うように構成された、または動作
可能なデバイスが開示される。この装置は、この方法を実装するようにプログラムされた
プロセッサを含んでもよい。
【0009】
さらに別の代表的な態様において、映像デコーダ装置は、本明細書で説明されるような
方法を実装してもよい。
【0010】
開示される技術の上記および他の態様および特徴は、図面、説明および特許請求の範囲
でより詳細に説明される。
【図面の簡単な説明】
【0011】
【
図1】
図1は、12個のタイルおよび3つのラスタスキャンスライスに区分された、18×12個の輝度コーディングツリーユニット(CTU)を有するピクチャの例を示す。
【
図2】
図2は、24個のタイルおよび9個の矩形スライスに区分された、18×12個の輝度CTUを有するピクチャの例を示す。
【
図3】
図3は、4つのタイルおよび4つの矩形スライスに区分されたピクチャの例を示す。
【
図4】
図4は、15個のタイル、24個のスライス、及び24個のサブピクチャに分割されたピクチャの例を示す。
【
図5】
図5は、映像処理の方法の一例を示すフローチャートを示す。
【
図6】
図6は、映像処理装置の例を示すブロック図である。
【
図7】
図7は、映像コーディングシステムの一例を示すブロック図である。
【
図8】
図8は、符号化の一例を示すブロック図である。
【
図9】
図9は、復号化の一例を示すブロック図である。
【
図10】
図10は、開示された技術を実装することができる映像処理システムの一例を示すブロック図である。
【
図11】
図11は、開示された技術のいくつかの実装形態に基づく、映像処理方法の一例を示すフローチャートである。
【発明を実施するための形態】
【0012】
より高い解像度の映像の需要が増大しているため、近代技術において、映像コーディン
グ法および技術は、遍在している。映像コーデックは、一般的に、デジタル映像を圧縮又
は展開する電子回路又はソフトウェアを含み、より高いコーディング効率を提供するよう
に絶えず改良されている。映像コーデックは、非圧縮映像を圧縮フォーマットに変換する
、又はその逆である。映像の品質、映像を表現するために使用されるデータの数(ビット
レートにより決まる)、符号化および復号化アルゴリズムの複雑性、データの損失および
エラーに対する敏感さ、編集のしやすさ、ランダムアクセス、およびエンドツーエンドの
遅延(待ち時間)の間には複雑な関係がある。この圧縮フォーマットは、通常、標準的な
映像圧縮仕様、例えば、高効率映像コーディング(HEVC)規格(H.265またはM
PEG-H Part 2としても知られている)、完成させるべき汎用映像コーディン
グ規格、または他の現在のおよび/または将来の映像コーディング基準に準拠する。
【0013】
開示される技術の実施形態は、ランタイム性能を向上させるために、既存の映像コーデ
ィング規格(例えば、HEVC、H.265)および将来の規格に適用されてもよい。本
発明は、具体的には、映像コーディング化におけるマージモードに関する。本明細書では
、説明の可読性を向上させるために章の見出しを使用しており、説明又は実施形態(及び
/又は実装形態)をそれぞれの章のみに限定するものではない。
【0014】
1.例示的な実施形態の概要
開示される技術の実施例は、コーディングされた映像ビットストリームにおけるコーデ
ィングされたピクチャ内の映像コーディング層(VCL)ネットワーク抽象化層(NAL
)ユニットの復号順を規定することに向けられる。本発明は、ピクチャをスライス及びサ
ブピクチャの分割に対応可能な任意の映像コーディング規格、例えば、開発されている汎
用映像コーディング(VVC)、又は他の任意の映像コーディング規格若しくは映像コー
デックに適用されてもよい。
【0015】
2.本明細書で使用される略語のリスト
APS Adaptation Parameter Set(適応パラメータセッ
ト)
【0016】
AU Access Unit(アクセスユニット)
【0017】
AUD Access Unit Delimiter(アクセスユニットデリミタ
ー)
【0018】
AVC Advanced Video Coding(高度映像コーディング)
【0019】
CRA Clean Random Access(クリーンランダムアクセス)
【0020】
CTU Coding Tree Unit(コーディングツリーユニット)
【0021】
CVS Coded Video Sequence(コーディング映像シーケンス
)
【0022】
DPS Decoding Parameter Set(復号パラメータセット)
【0023】
EOB End Of Bitstream(ビットストリーム終端)
【0024】
EOS End Of Sequence(シーケンス終端)
【0025】
GDR Gradual Decoding Refresh(漸次的復号化リフレ
ッシュ)
【0026】
HEVC High Efficiency Video Coding(高効率映像
コーディング)
【0027】
IDR Instantaneous Decoding Refresh(
瞬時復号化リフレッシュ)
【0028】
JEM Joint Exploration Model(共同探索モデル)
【0029】
MCTS Motion-Constrained Tile Sets(動作制約タ
イルセット)
【0030】
NAL Network Abstraction Layer(ネットワーク抽象
化層)
【0031】
PH Picture Header(ピクチャヘッダ)
【0032】
PPS Picture Parameter Set(ピクチャパラメータセット
)
【0033】
PU Picture Unit(ピクチャユニット)
【0034】
RBSP Raw Byte Sequence Payload(生バイトシーケン
スペイロード)
【0035】
SEI Supplemental Enhancement Informati
on(補足強化情報)
【0036】
SPS Sequence Parameter Set(シーケンスパラメータセ
ット)
【0037】
VCL Video Coding Layer(映像コーディング層)
【0038】
VPS Video Parameter Set(映像パラメータセット)
【0039】
VTM VVC Test Model(VVC試験モデル)
【0040】
VUI Video Usability Information(映像ユーザビ
リティ情報)
【0041】
VVC Versatile Video Coding(汎用映像コーディング)
【0042】
3.背景技術
映像コーディング規格は、主に周知のITU-TおよびISO/IEC規格の開発によ
って発展してきた。ITU-TはH.261とH.263を作り、ISO/IECはMP
EG-1とMPEG-4 Visualを作り、両団体はH.262/MPEG-2 V
ideoとH.264/MPEG-4 AVC(Advanced Video Cod
ing)とH.265/HEVC規格を共同で作った。H.262以来、映像コーディン
グ規格は、時間予測と変換コーディングが利用されるハイブリッド映像コーディング構造
に基づく。HEVCを超えた将来の映像コーディング技術を探索するため、2015年に
は、VCEGとMPEGが共同でJVET(Joint Video Explorat
ion Team)を設立した。それ以来、多くの新しい方法がJVETによって採用さ
れ、JEM(Joint Exploration Model)と呼ばれる参照ソフト
ウェアに組み込まれてきた。JVETは四半期に1回開催され、新しいコーディング規格
はHEVCに比べて50%のビットレート低減を目指している。2018年4月のJVE
T会議において、新しい映像コーディング規格を「汎用映像コーディング(Versat
ile Video Coding:VVC)」と正式に命名し、その時、第1版のVV
Cテストモデル(VTM)をリリースした。
【0043】
3.1 HEVCにおけるピクチャ分割スキーム
HEVCには、正規のスライス、依存性のあるスライス、タイル、WPP(Wavef
ront Parallel Processing)という4つの異なる画像分割スキ
ームがあり、これらを適用することで、最大転送ユニット(MTU)サイズのマッチング
、並列処理、エンドツーエンドの遅延の低減が可能になる。
【0044】
正規のスライスは、H.264/AVCと同様である。各正規のスライスは、それ自体
のNALユニットにカプセル化され、スライス境界にわたるインピクチャ予測(イントラ
サンプル予測、動き情報予測、コーディングモード予測)およびエントロピーコーディン
グ依存性は無効化される。このように、1つの正規のスライスは、同じピクチャ内の他の
正規のスライスとは独立して再構成することができる(しかし、ループフィルタリング動
作のために依然として相互依存性が残っている場合がある)。
【0045】
正規のスライスは、並列化に使用できる唯一のツールであり、H.264/AVCでも
ほぼ同じ形式で使用できる。正規のスライスに基づく並列化は、プロセッサ間通信または
コア間通信をあまり必要としない(予測コーディングされたピクチャを復号化するとき、
動き補償のためにプロセッサ間またはコア間データ共有を除いて、通常、ピクチャ内予測
のためにプロセッサ間またはコア間データ共有よりもはるかに重い)。しかしながら、同
じ理由で、正規のスライスを使用すると、スライスヘッダのビットコストおよびスライス
境界にわたる予測が欠如していることに起因して、コーディングのオーバーヘッドが大き
くなる可能性がある。さらに、レギュラースライスは(後述の他のツールとは対照的に)
、レギュラースライスのピクチャ内独立性および各レギュラースライスがそれ自体のNA
Lユニットにカプセル化されることに起因して、MTUサイズ要件に適応するようにビッ
トストリームを分割するための鍵となるメカニズムとしても機能する。多くの場合、並列
化の目標およびMTUサイズマッチングの目標は、画像におけるスライスレイアウトに矛
盾する要求を課す。このような状況を実現したことにより、以下のような並列化ツールが
開発された。
【0046】
従属スライスは、ショートスライスヘッダを有し、ピクチャ内予測を一切中断すること
なく、ツリーブロック境界でビットストリームを区分することを可能にする。基本的に、
従属スライスは、正規のスライスを複数のNALユニットに断片化し、正規のスライス全
体の符号化が完了する前に正規のスライスの一部を送出することを可能にすることによっ
て、エンドツーエンド遅延を低減する。
【0047】
WPPにおいて、ピクチャは、単一行のコーディングツリーブロック(CTB)に分割
される。エントロピー復号化および予測は、他の分割におけるCTBからのデータを使用
することを許可される。CTB行の並列復号によって並列処理が可能であり、1つのCT
B行の復号化の開始が2つのCTBだけ遅延され、それによって、対象のCTBが復号化
される前に、対象のCTBの右上のCTBに関するデータが確実に利用可能になる。この
互い違いのスタート(グラフで表される場合、波面のように見える)を使用することで、
ピクチャがCTB行を含む数までのプロセッサ/コアを用いて並列化することが可能であ
る。1つのピクチャ内の近傍のツリーブロック行間のピクチャ内予測が許可されるので、
ピクチャ内予測を可能にするために必要なプロセッサ間/コア間通信は十分となり得る。
WPP分割は、適用されない場合と比較して、追加のNALユニットの生成をもたらさず
、従って、WPPは、MTUサイズマッチングのためのツールではない。しかし、MTU
サイズのマッチングが必要な場合、一定のコーディングオーバーヘッドを伴って、WPP
で正規のスライスを使用することができる。
【0048】
タイルは、ピクチャをタイルの列および行に分割する水平および垂直境界を規定する。
タイルの列は、ピクチャの上からピクチャの下へと延びている。同様に、タイルの行は、
ピクチャの左からピクチャの右に延びる。ピクチャにおけるタイルの数は、単にタイル列
の数にタイル行の数を乗算することで得ることができる。
【0049】
CTBのスキャン順序は、1つのタイル内でローカルになるように(1つのタイルのC
TBラスタスキャンの順に)変更され、その後、1つのピクチャのタイルラスタスキャン
の順に従って、次のタイルの左上のCTBを復号する。正規のスライスと同様に、タイル
は、ピクチャ内予測依存性およびエントロピー復号化依存性を損なう。しかしながら、こ
れらは、個々のNALユニット(この点でWPPと同じ)に含まれる必要がなく、従って
、タイルは、MTUサイズマッチングに使用できない。各タイルは、1つのプロセッサ/
コアによって処理されてもよく、処理ユニット間のピクチャ内予測に必要なプロセッサ/
コア間通信では、近傍タイルの復号化は、1つのスライスが2つ以上のタイルにまたがっ
ている場合、共有スライスヘッダの伝達と、再構築されたサンプルおよびメタデータのル
ープフィルタリングに関連する共有とに限定される。1つのスライスに2つ以上のタイル
またはWPPセグメントが含まれる場合、該スライスにおける最初の1つ以外の各タイル
またはWPPセグメントのエントリポイントバイトオフセットが、スライスヘッダにおい
て信号通知される。
【0050】
説明を簡単にするために、HEVCにおいては、4つの異なるピクチャ分割方式の適用
に関する制限が規定されている。所与のコーディングされた映像シーケンスは、HEVC
に指定されたプロファイルのほとんどについて、タイルおよび波面の両方を含むことがで
きない。各スライスおよびタイルについて、以下のいずれかまたは両方の条件を満たさな
ければならない。1)1つのスライスにおけるすべてのコーディングされたツリーブロッ
クは、同じタイルに属し、2)1つのタイルにおけるすべてのコーディングされたツリー
ブロックは、同じスライスに属する。最後に、1つの波面セグメントはちょうど1つのC
TB行を含み、WPPが使用されている時に、1つのスライスが1つのCTB行内で始ま
る場合、同じCTB行で終わらなければならない。
【0051】
最近のHEVCの修正は、JCT-VCの出力文書であるJCTVC-AC1005、
J.ボイス、A.ラマスブラモニアン、R.スクピン、G.J.スリ版、A.トゥラピス
、Y.-K.ワング(editors),“HEVC 追加の捕捉強化情報(Draft
4),”Oct.24,2017,下記で入手可能:http://phenix.in
t-evry.fr/jct/doc_end_user/documents/29_
Macau/wg11/JCTVC-AC1005-v2.zipこの補正を含め、HE
VCは、3つのMCTS関連SEIメッセージ、即ち、時間MCTS SEIメッセージ
、MCTS抽出情報セットSEIメッセージ、およびMCTS抽出情報ネストSEIメッ
セージを特定する。
【0052】
時間MCTS SEIメッセージは、ビットストリーム中にMCTSが存在することを
示し、MCTSに信号を送信する。各MCTSにおいて、動きベクトルは、MCTS内部
のフルサンプル位置と、補間のためにMCTS内部のフルサンプル位置のみを必要とする
フラクショナルサンプル位置とを指すように制限され、且つ、MCTS外部のブロックか
ら導出された時間動きベクトル予測のための動きベクトル候補の使用は許可されない。こ
のように、各MCTSは、MCTSに含まれていないタイルが存在せず、独立して復号化
されてもよい。
【0053】
MCTS抽出情報セットSEIメッセージは、MCTSサブビットストリーム抽出(S
EIメッセージの意味の一部として指定される)において使用され得る補足情報を提供し
、MCTSセットのための適合ビットストリームを生成する。この情報は、複数の抽出情
報セットを含み、各抽出情報セットは、複数のMCTSセットを定義し、MCTSサブビ
ットストリーム抽出処理において使用される代替VPS、SPS、およびPPSのRBS
Pバイトを含む。MCTSサブビットストリーム抽出プロセスによってサブビットストリ
ームを抽出する場合、パラメータセット(VPS,SPS,PPS)を書き換えるかまた
は置き換える必要があるが、その理由は、スライスアドレスに関連する構文要素の1つま
たは全て(first_slice_segment_in_pic_flagおよびs
lice_segment_addressを含む)が異なる値となる必要があるためで
ある。
【0054】
3.2. VVCにおけるピクチャの分割
VVCにおいて、1つのピクチャは、1つ以上のタイル行および1つ以上のタイル列に
分割される。1つのタイルは、1つの画像の1つの矩形領域を覆う1つのCTUのシーケ
ンスである。1つのタイルにおけるCTUは、そのタイル内でラスタスキャン順にスキャ
ンされる。
【0055】
1つのスライスは、1つのピクチャのタイル内において、整数個の完全なタイルまたは
整数個の連続した完全なCTU行を含む。
【0056】
2つのモードのスライス、即ちラスタスキャンスライスモードおよび矩形スライスモー
ドに対応している。ラスタスキャンスライスモードにおいて、1つのスライスは、1つの
ピクチャのタイルラスタスキャンにおける1つの完全なタイルのシーケンスを含む。矩形
スライスモードにおいて、1つのスライスは、ピクチャの矩形領域を集合的に形成する複
数の完全なタイル、またはピクチャの矩形領域を集合的に形成する1つのタイルの複数の
連続した完全なCTU行のいずれかを含む。矩形スライス内のタイルを、そのスライスに
対応する矩形領域内で、タイルラスタスキャンの順にスキャンする。
【0057】
1つのサブピクチャは、1つのピクチャの矩形領域を集合的に覆う1つ以上のスライス
を含む。
【0058】
図1は、ピクチャのラスタスキャンスライス区分の例を示し、ピクチャは、12個のタ
イルと3個のラスタスキャンスライスとに分割される。
【0059】
図2は、ピクチャを矩形スライス区分の例を示し、ピクチャは、24個のタイル(6個
のタイル列および4個のタイル行)と9個の矩形スライスとに分割される。
【0060】
図3は、タイルおよび矩形のスライスに分割されたピクチャの例を示し、このピクチャ
は、4つのタイル(2つのタイルの列および2つのタイルの行)と4つの矩形スライスと
に分割される。
【0061】
図4は、1つのピクチャをサブピクチャで分割する例を示し、1つのピクチャは、18
個のタイルに分割され、左側の12個が、4×4のCTUの1つのスライスをそれぞれ含
み、右側の6個のタイルが、2×2のCTUの垂直方向に積み重ねられたスライスをそれ
ぞれ含み、全体で24個のスライス及び24個の異なる寸法のサブピクチャとなる(各ス
ライスは、1つのサブピクチャ)。
【0062】
3.3 VVCにおけるサブピクチャ、スライスおよびタイルの信号通知
最近のVVC草案テキストにおいて、サブピクチャの情報は、サブピクチャのレイアウ
ト(即ち、各ピクチャのサブピクチャの数、および各ピクチャの位置及びサイズ)と、他
のシーケンスレベルのサブピクチャ情報とを含み、これらの情報は、SPSにおいて信号
通知される。SPSにおいて信号通知されるサブピクチャの順序は、サブピクチャインデ
ックスを規定する。各サブピクチャに1つのサブピクチャIDのリストは、例えば、SP
S又はPPSにおいて、明示的に信号通知されてもよい。
【0063】
VVCにおけるタイルは、概念的にはHEVCにおけるものと同じであり、即ち、各ピ
クチャは、タイルの列及びタイルの行に分割されるが、PPSではタイルの信号通知のた
めに異なる構文を有する。
【0064】
VVCにおいて、スライスモードもPPSで信号通知される。スライスモードが矩形ス
ライスモードである場合、PPSにおいて、各ピクチャのスライスレイアウト(即ち、各
ピクチャのスライス数、各スライスの位置及びサイズ)が信号通知される。PPSにおい
て信号通知されるピクチャ内の矩形スライスの順序は、ピクチャレベルのスライスインデ
ックスを規定する。サブピクチャレベルのスライスインデックスは、サブピクチャにおけ
るスライスの順番として、ピクチャレベルのスライスインデックスの昇順に定義される。
矩形スライスの位置及びサイズは、SPSにおいて信号通知されるサブピクチャの位置及
びサイズ(各サブピクチャが1つのスライスのみを含む場合)に基づいて、又は、PPS
において信号通知されるタイルの位置及びサイズに基づいて(1つのサブピクチャが1つ
以上のスライスを含む場合)、信号通知/導出される。スライスモードがラスタスキャン
スライスモードである場合、HEVCと同様に、1つのピクチャ内のスライスのレイアウ
トは、スライスそのものに異なる詳細で信号通知される。
【0065】
3.4 VVCにおけるコーディングされたスライスのサブピクチャID及びスライス
アドレス
VVCにおいて、VCL NALユニットは、コーディングされたスライスNALユニ
ットに相当する。各コーディングされたスライスは、サブピクチャID(slice_s
ubpic_id)及びスライスアドレス(slice_address)を含むスライ
スヘッダを含む。この1対のパラメータは、ピクチャ内のスライス内でココーディングさ
れたサンプルの位置を示す。
【0066】
スライスモードが矩形スライスモードである(即ち、rect_slice_flag
が1に等しい)場合、スライスアドレスは、サブピクチャ内のスライスのうち、スライス
の(サブピクチャレベル)スライスインデックスを規定する。
【0067】
そうでない場合(rect_slice_flagが1に等しく、スライスモードがラ
スタスキャンスライスモードであり、この場合、ピクチャ全体が1つのサブピクチャであ
る)、スライスアドレスは、ピクチャ内のタイルインデックスを規定する。
【0068】
以下では、便宜上、一般的なスライスヘッダの意味論の一部であるslice_sub
pic_id及びスライスアドレスの意味論を含む。
【0069】
7.4.8.1 一般スライスヘッダ意味論
スライスヘッダ構文要素slice_pic_order_cnt_lsbの値があれば
、コーディングされたピクチャのすべてのスライスヘッダにおいて同じである。
...
【0070】
【0071】
- sps_subpic_id_signalling_present_flag
が1に等しい場合、slice_subpic_idの長さはsps_subpic_i
d_len_minus1+1に等しい。
- そうでない場合、ph_subpic_id_signalling_prese
nt_flagが1に等しい場合、slice_subpic_idの長さはph_su
bpic_id_len_minus1+1に等しい。
- そうでない場合、pps_subpic_id_signalling_pres
ent_flagが1に等しい場合、slice_subpic_idの長さはpps_
subpic_id_len_minus1+1に等しい。
- そうでない場合、slice_subpic_idの長さは、Ceil(Log2
(sps_num_subpics_minus1+1))に等しい。
【0072】
【0073】
- スライスアドレスは、ラスタスキャンタイルインデックスである。
- slice_addressの長さは、Ceil(Log2(NumTilesI
nPic))ビットである。
- slice_addressの値は、0からNumTilesInPic-1まで
の範囲内にあるべきである。
そうでない場合(rect_slice_flagが1に等しい場合)、以下が適用さ
れる。
- スライスアドレスは、SubPicIdx番目のサブピクチャ内のスライスのスラ
イスインデックスである。
- slice_addressの長さは、Ceil(Log2(NumSlices
InSubpic[SubPicIdx]))ビットである。
- slice_addressの値は、0~NumSlicesInSubpic[
SubPicIdx]-1までの範囲内とする。
ビットストリーム適合性の要件は、以下の制約が適用されることである。
- rect_slice_flagが0に等しい、又はsubpics_prese
nt_flagが0に等しい場合、slice_addressの値は、同じコーディン
グされたピクチャにおいて任意の他のコーディングされたスライスNALユニットのsl
ice_addressの値に等しくてはならない。
- そうでない場合、slice_subpic_id及びslice_addres
s値の組は、同じコーディングされたピクチャにおいて任意の他のコーディングされたス
ライスNALユニットのslice_subpic_id及びslice_addres
s値の組に等しくてはならない。
- rect_slice_flagが0に等しい場合、ピクチャのスライスは、その
slice_address値の昇順となる。
- ピクチャのスライスの形状は、各CTUが復号された場合、その左側境界全体及び
最上の境界全体が1つのピクチャの境界、又は、以前に復号されたCTUの境界を含むも
のでなければならない。
...
【0074】
3.5 NALユニットの復号化の順序
VVCにおいて、NALユニットの復号順(即ち、VVCビットストリームにおけるN
ALユニットの順序)は、最新のVVC草案テキストの7.4.2.4項、およびその従
属節、並びに、SPS意味論(7.4.3.3項)、および一般的なスライスヘッダ意味
論(7.4.8.1項)に規定されている。以下では、便宜上、これらのテキストをコピ
ーして貼り付けている。
【0075】
7.4.2.4 NALユニットの順序及びコーディングされたピクチャ、PU、AU
、及びコーディングされた映像シーケンスへの関連付け
【0076】
7.4.2.4.1 一般
この項では、ビットストリームにおけるNALユニットの順序に関する制約を規定する
。
これらの制約に従うビットストリームにおけるNALユニットの任意の順序は、本明細
書ではNALユニットの復号順と呼ばれる。NALユニット内で、項目7.3及びD.2
における構文は、構文要素の復号順を規定する。本明細書に規定されるNALユニットに
、ITU-T H.SEI | ISO/IEC 23002-7に規定されるVUIパ
ラメータ又はSEIメッセージが含まれている場合、ITU-T H.SEI|ISO/
IEC 23002-7に規定されるVUIパラメータ又はSEIメッセージの構文は、
これらの構文要素の復号順を規定する。デコーダは、NALユニット及びそれらの構文要
素をデコード順に受信することができる。
【0077】
7.4.2.4.2 AUの順番及びCVSへの関連付け
本仕様に準拠するビットストリームは、1つ以上のCVSからなる。
CVSは、1つ以上のAUからなる。NALユニット及びコーディングされたピクチャ
の順番及びAUとの関連付けは、7.4.2.4.3項に記載されている。
CVSの最初のAUは、CVSS AUであり、現在の各PUは、CLVSS PUであ
り、NoIncorrectPicOutputFlagが1に等しいIRAP PU、
又はNoIncorrectPicOutputFlagが1に等しいGDR PUのい
ずれかである。
各CVSS AUは、CVSに存在する各層に1つのピクチャを有する。
ビットストリーム適合性の要件がある場合、EOS NALユニット又はEOB NAL
ユニットを含むAUの後の次のAUにおける各PUが、IDR PUまたはCRA PU
またははGDR PUであり得るIRAP PUであることである。
【0078】
7.4.2.4.3 NALユニット及びコーディングされたピクチャの順序並びにP
U及びAUとの関連付け
本項は、NALユニット及びコーディングされたピクチャの順序、並びに、附属書Aに
規定されたプロファイルの1つ以上に準拠し、かつ、第2項から第9項に規定される復号
処理を使用して復号されたCVSのためのPU及びAUへのそれらの関連付けを規定する
。
1つのPUは、1つのPH NALユニットと、1つ以上のVCL NALユニットを
備える1つのコーディングされたピクチャと、ゼロ以上の非VCL NALユニットとか
らなる。VCL NALユニットのコーディングされたピクチャへの関連付けは、7.4
.2.4.4項に記載されている。
AUは、nuh_layer_idの昇順に、ゼロ又は1つのAU区切り文字NALユ
ニットと、1つ以上のPUとからなる。
ビットストリームにおける最初のAUは、ビットストリームの最初のNALユニットから
始まる。AUには、最大1つのAU区切り文字NALユニットが存在するものとする。
ピクチャの最初のVCL NALユニットは、ピクチャの復号順で、PH NALユニッ
トの後に続く最初のVCL NALユニットである。
VCL NALユニットが1つのピクチャの最初のVCL NALユニットであり、且
つ、以下の条件が1つ以上真である場合、VCL NALユニットはAUの最初のVCL
NALユニットである(従って、最初のVCL NALユニットを含むピクチャはAU
の最初のピクチャである)。
- VCL NALユニットのnuh_layer_idの値は、復号順で前のピクチ
ャのnuh_layer_idよりも小さい。
- VCL NALユニットのslice_pic_order_cnt_lsbの値
は、復号順で前のピクチャのPicOrderCntValの値と異なる。
- VCL NALユニットに対して導出されたPicOrderCntValは、復
号順で前のピクチャのPicOrderCntValと異なる。
firstVclNalUnitInAuをAUの最初のVCL NALユニットとす
る。firstVclNalUnitInAuに先行し、firstVclNalUni
tInAuに先行する最後のVCL NALユニットに続く以下のNALユニットのうち
のいずれか最初のものがあれば、それが新しいアクセスユニットの開始を規定する。
- AUD NAL ユニット (存在する場合)、
- DPS NAL ユニット (存在する場合)、
- VPS NAL ユニット (存在する場合)、
- SPS NAL ユニット (存在する場合)、
- PPS NAL ユニット (存在する場合)、
- Prefix APS NAL ユニット (存在する場合)、
- PH NAL ユニット、
- Prefix SEI NAL ユニット (存在する場合)、
- nal_unit_typeがRSV_NVCL_26 に等しいNALユニット
(存在する場合)、
- nal_unit_typeがUNSPEC28..UNSPEC29 (存在す
る場合)の範囲にあるNALユニット。
注:firstVclNalUnitInAuに先行し、firstVclNalUn
itInAuに先行する最後のVCL NALユニットに続く最初のNALユニットがあ
れば、それのみが上に列記したNALユニットのうちの1つになり得る。
PU又はAUにおけるコーディングされたピクチャ及び非VCL NALユニットの順番
は、以下の制約に従う。
- AUデリミタNALユニットがAUに存在する場合、AUの最初のNALユニット
とする。
- PUにおけるPH NALユニットは、PUの最初のVCL NALに先行するも
のとする。
- PU内に、DPS NALユニット、VPS NALユニット、SPS NALユ
ニット、PPS NALユニット、プレフィクスAPS NALユニット、プレフィクス
SEI NALユニット、nal_unit_typeがRSV_NVCL_26に等し
いNALユニット、又は、NALユニットがUNSPEC_28..UNSPEC_29
の範囲にあるNALユニットが存在する場合、それらはPUの最後のVCL NALユニ
ットを追従しないものとする。
- PU内にDPS NALユニット、VPS NALユニット、SPS NALユニ
ット、又は、PPS NALユニットが存在する場合、それらはPUのPH NALユニ
ットに先行するものとする。
- PUにおけるnal_unit_typeがSUFFIX_APS_NUT、SU
FFIX_SEI_NUT、FD_NUT、又はRSV_NVCL_27に等しい、又は
、UNSPEC_30...UNSPEC_31の範囲内にあるNALユニットは、PU
の最初のVCL NALユニットより先行することはないものとする。
- EOS NALユニットが1つのPU内に存在する場合、EOB NALユニット
(存在する場合)以外のPU内にあるすべてのNALユニットのうち、最後のNALユニ
ットとするものとする。
- 1つのEOB NALユニットが1つのAU内に存在する場合、それはこのAU内
における最後のNALユニットをするものとする。
【0079】
7.4.3.3 シーケンスパラメータセットRBSP意味論
SPS RBSPは、それが参照される前に、復号処理に利用可能であり、Tempo
ralIdが0に等しい、又は外部手段によって提供される少なくとも1つのAUに含ま
れる。
...
ビットストリーム適合性の要件は、以下の制約が適用されることである。
- 任意の2つのサブピクチャsubpicA及びsubpicBの場合、subpi
cAのサブピクチャインデックスがsubpicBのサブピクチャインデックスよりも小
さい場合、subPicAの任意のコーディングされたスライスNALユニットは、復号
順で、subPicBの任意のコーディングされたスライスNALユニットに先行するも
のとする。
-...
...
【0080】
7.4.8.2 一般的なスライスヘッダ意味論
スライスヘッダ構文要素slice_pic_order_cnt_lsbの値があれ
ば、コーディングされたピクチャのすべてのスライスヘッダにおいて同じである。
...
ビットストリーム適合性の要件は、以下の制約が適用されることである。
-...
- rect_slice_flagが0に等しい場合、ピクチャのスライスは、その
slice_address値の昇順となる。
-...
...
【0081】
4.既存の実装形態の欠点
既存のVVC設計において、次のような問題がある。
【0082】
(1)スライスモードが矩形スライスモードである場合、1つのサブピクチャ内のV
CL NALユニット(すなわち、コーディングされたスライスNALユニット)の復号
順は規定されない。その結果、適合したデコーダ実装は、スライスモードが矩形スライス
モードである場合、1つのサブピクチャ内で任意の順序のVCL NALユニットを有す
るビットストリームを正確に復号できるかどうかをテストし、確認する必要がある。これ
は、例えば実装中の適合性試験のために、デコーダ実装に重い負荷を課すことになる。
【0083】
(2)slice_subpic_idがスライスヘッダ内に存在しない場合、その
値を推測する必要があり、例えば、ピクチャ内のVCL NALユニットのNALユニッ
ト復号順を規定するために使用される。
【0084】
(3)SPS又はPPSにおいて明示的に信号通知されるサブピクチャIDの値は、
サブピクチャインデックス値の昇順に対してサブピクチャIDの値の順序が変わらないよ
うに制約する必要があり、これにより、適合性試験等でデコーダの実装負荷がかかる。
【0085】
5.開示される技術の実施例
以下の詳細な実施形態は、一般的な概念を説明するための例であると考えられるべきで
ある。これらの実施形態は狭い意味で解釈されるべきではない。さらに、これらの実施形
態は、任意の方法で組み合わせることができる。
1)スライスモードが矩形スライスモードである場合、1つのサブピクチャ内のVC
L NALユニット(すなわち、コーディングされたスライスNALユニット)の復号順
は、このVCL NALユニットを含むサブピクチャのサブピクチャID値の昇順となる
ように規定される。
代替的に、スライスモードが矩形スライスモードである場合、1つのサブピクチャ内のV
CL NALユニット(即ち、コーディングされたスライスNALユニット)の復号順は
、このVCL NALユニットを含むサブピクチャのサブピクチャインデックス値の昇順
となるように規定される。
2)スライスモードが矩形スライスモードである場合、1つのサブピクチャ内のVC
L NALユニット(即ち、コーディングされたスライスNALユニット)の復号順は、
このVCL NALユニットのサブピクチャレベルのスライスインデックス値の昇順とな
るように規定される。なお、コーディングされたスライスNALユニットのサブピクチャ
レベルのスライスインデックス値は、実際には、スライスヘッダにおけるslice_a
ddress構文要素の値である。
3)slice_subpic_idが存在しない場合、slice_subpic
_idの値は、例えば、0に等しいと推測される。
4)サブピクチャIDの値は、サブピクチャインデックスの昇順に大きくなる必要が
ある。
なお、最近のVVC草案テキストにおいて、1つのピクチャ内の、異なるサブピクチ
ャに属する任意の2つのVCL NALユニット(即ち、コーディングされたスライスN
ALユニット)の復号順は、既に、このVCL NALユニットを含むサブピクチャのサ
ブピクチャインデックス値の昇順に規定されている。
この制約を加えることで、1つのピクチャ内の、異なるサブピクチャに属する任意の
2つのVCL NALユニットの復号順を、このVCL NALユニットを含むサブピク
チャのサブピクチャID値の昇順に規定することができる。
【0086】
上述した例は、以下に説明する方法、例えば、方法500のコンテキストに含まれても
よく、これらの方法は、映像復号化または映像符号化において実装されてもよい。
【0087】
図5は、動画処理の例示的な方法500のフローチャートを示す。本方法は、動作51
0において、現在の映像セグメントと、複数の映像コーディング層(VCL)ネットワー
ク抽象化層(NAL)ユニットを含む映像のビットストリーム表現との間での変換につい
て、現在の映像セグメントを含むスライスのスライスモードが、矩形スライスモードであ
ることを決定することを含む。
【0088】
この方法は、動作520において、この決定に基づいて、この変換を行うことを含み、
このビットストリーム表現は、複数のVCL NALユニットの復号順を信号通知する1
つ以上の構文要素をさらに含む。
【0089】
6.追加の例示的な実施形態
【0090】
【0091】
6.1 第1の実施形態
【0092】
6.1.1 定義(VVC第3項)
【0093】
【0094】
6.1.2 CTBラスタスキャン、タイルスキャン、及びサブピクチャスキャン処理
の定義(VVC 6.5.1項)
...
【0095】
【0096】
for(j=0;j<=sps_num_subpics_minus1;j++)
NumSlicesInSubpic[j]=0
for(i=0;i<=num_slices_in_pic_minus1;i+
+){
posX=CtbAddrInSlice[i][0]%PicWidthInC
tbsY*CtbSizeY
posY=CtbAddrInSlice[i][0]/PicWidthInC
tbsY*CtbSizeY
for(j=0;j<=sps_num_subpics_minus1;j++
){
if((posX>=subpic_ctu_top_left_x[j]*C
tbSizeY)&& (32)
(posX<(subpic_ctu_top_left_x[j]+su
bpic_width_minus1[j]+1)*CtbSizeY)&&
(posY>=subpic_ctu_top_left_y[j]*Ct
bSizeY)&&
(posY<(subpic_ctu_top_left_y[j]+su
bpic_height_minus1[j]+1)*CtbSizeY)){
SliceSubpicToPicIdx[j][NumSlicesInS
ubpic[j]]=i
NumSlicesInSubpic[j]++
}
}
}
...
【0097】
6.1.3 ビットストリームにおけるNALユニットの順番(VVC 7.4.2.
4項)
【0098】
7.4.2.4 ビットストリームにおけるNALユニットの順番
【0099】
7.4.2.4.1 一般
7.4.2.4項の従属節は、ビットストリームにおけるNALユニットの順序に関す
る制約を規定する。これらの制約に従うビットストリームにおけるNALユニットの任意
の順序は、本明細書ではNALユニットの復号順と呼ばれる。
NALユニット内で、項目7.3及びD.2における構文は、構文要素の復号順を規定
する。本明細書に規定されるNALユニットに、ITU-T H.SEI|ISO/IE
C 23002-7に規定されるVUIパラメータ又はSEIメッセージが含まれている
場合、ITU-T H.SEI|ISO/IEC 23002-7に規定されるVUIパ
ラメータ又はSEIメッセージの構文は、これらの構文要素の復号順を規定する。デコー
ダは、NALユニット及びそれらの構文要素をデコード順に受信することができる。
【0100】
7.4.2.4.2 AUの順序及びそれらのCVSへの関連付け
ビットストリームは、1つ以上のCVSからなる。CVSは、1つ以上のAUからなる
。PUの順番及びAUとの関連付けは、項目0に記載されている。
CVSの最初のAUは、CVSS AUであり、現在の各PUは、CLVSS PUで
あり、NoIncorrectPicOutputFlagが1に等しいIRAP PU
、又はNoIncorrectPicOutputFlagが1に等しいGDR PUの
いずれかである。
各CVSS AUは、CVSに存在する各層に1つのPUを有する。
EOB NALユニットを含むAUの後に次のAUがある場合、ビットストリーム適合
性の要件は、存在する場合、CVSS AUとする。
【0101】
7.4.2.4.3 PUの順番及びAUとの関連付け
1つのAUは、nuh_layer_idの昇順に1つ以上のPUを含む。NALユニ
ットの順番及びコーディングされたピクチャ、並びにそれらのPUとの関連付けは、7.
4.2.4.4項に記載されている。
1つのAUには、最大1つのAUD NALユニットがあってもよい。AUD NAL
ユニットがAUに存在する場合、AUの最初のNALユニットとなり、その結果、AUの
最初のPUの最初のNALユニットとなる。
1つのAUには、最大1つのEOB NALユニットが存在してもよい。1つAUに1
つのEOB NALユニットが存在する場合、このユニットはこのAUの最後のNALユ
ニットとなり、その結果、このAUの最後のPUの最後のNALユニットとなる。
1つのVCL NALユニットがPH NALユニットに続く最初のVCL NALユ
ニットであり、以下の条件が1つ以上真である場合、VCL NALユニットはAUの最
初のVCL NALユニットとなる(その結果、VCL NALユニットを含むPUは、
AUの最初のPUとなる)。
- VCL NALユニットのnuh_layer_idの値は、復号順で前のピクチ
ャのnuh_layer_idよりも小さい。
- VCL NALユニットのslice_pic_order_cnt_lsbの値
は、復号順で前のピクチャのPicOrderCntValの値と異なる。
- VCL NALユニットに対して導出されたPicOrderCntValは、復
号順で前のピクチャのPicOrderCntValと異なる。
firstVclNalUnitInAuをAUの最初のVCL NALユニットとす
る。firstVclNalUnitInAuに先行し、firstVclNalUni
tInAuに先行する最後のVCL NALユニットに続く、以下のNALユニットのう
ちいずれか最初のものがある場合、新しいAUの開始を規定する。
- AUD NAL ユニット (存在する場合)、
- DPS NAL ユニット (存在する場合)、
- VPS NAL ユニット (存在する場合)、
- SPS NAL ユニット (存在する場合)、
- PPS NAL ユニット (存在する場合)、
- Prefix APS NAL ユニット (存在する場合)、
- PH NAL ユニット、
- Prefix SEI NAL ユニット (存在する場合)、
- nal_unit_typeがRSV_NVCL_26 に等しいNALユニット
(存在する場合)、
- nal_unit_typeがUNSPEC28..UNSPEC29 (存在す
る場合)の範囲にあるNALユニット。
注:firstVclNalUnitInAuに先行し、firstVclNal
UnitInAuに先行する最後のVCL NALユニットに続く最初のNALユニット
があれば、それのみが上に列記したNALユニットのうちの1つになり得る。
ビットストリーム適合性の要件がある場合、それは同じ層に属し、EOS NALユニ
ット又はEOB NALユニットを含むPUの後の規定の層の次のPUが、NoInco
rrectPicOutputFlagが1に等しいIRAP PU、またはNoInc
orrectPicOutputFlagが1に等しいGDR PUのいずれかのCLV
SS PUであるとする。
【0102】
7.4.2.4.4 NALユニットおよびコーディングされたピクチャの順序、並び
に、それらのPUとの関連付け
1つのPUは、1つのPH NALユニットと、1つ以上のVCL NALユニットを
備える1つのコーディングされたピクチャと、ゼロ以上の他の非VCL NALユニット
を含む。VCL NALユニットのコーディングされたピクチャへの関連付けは、7.4
.2.4.4項に記載されている。
ピクチャの最初のVCL NALユニットは、ピクチャのPH NALユニットの後に
続く最初のVCL NALユニットである。
PU内の非VCL NALユニット(AUD及びEOB NALユニットを除く)の順
番は、以下の制約に従うものとする。
- PUにおけるPH NALユニットは、PUの最初のVCL NALに先行するも
のとする。
- PU内に、DPS NALユニット、VPS NALユニット、SPS NALユ
ニット、PPS NALユニット、プレフィクスAPS NALユニット、プレフィクス
SEI NALユニット、nal_unit_typeがRSV_NVCL_26に等し
いNALユニット、又は、NALユニットがUNSPEC_28..UNSPEC_29
の範囲にあるNALユニットが存在する場合、それらはPUの最後のVCL NALユニ
ットを追従しないものとする。
- PU内にDPS NALユニット、VPS NALユニット、SPS NALユニ
ット、又は、PPS NALユニットが存在する場合、それらはPUのPH NALユニ
ットに先行するものとする。
- PUにおけるnal_unit_typeがSUFFIX_APS_NUT、SU
FFIX_SEI_NUT、FD_NUT、又はRSV_NVCL_27に等しい、又は
、UNSPEC_30...UNSPEC_31の範囲内にあるNALユニットは、PU
の最初のVCL NALユニットより先行することはないものとする。
- EOS NALユニットが1つのPU内に存在する場合、EOB NALユニット
(存在する場合)以外のPU内にあるすべてのNALユニットのうち、最後のNALユニ
ットとするものとする。
【0103】
7.4.2.4.5 VCL NALユニットの順序およびそのコーディングされたピ
クチャへの関連付け
【0104】
【0105】
6.1.4 シーケンスパラメータセットRBSP意味論(VVC第7.4.3.3項
)
SPS RBSPは、それが参照される前に、復号処理に利用可能であり、Tempo
ralIdが0に等しい、又は外部手段によって提供される少なくとも1つのAUに含ま
れる。
...
ビットストリーム適合性の要件は、以下の制約が適用されることである。
【0106】
【0107】
6.1.5 一般スライスヘッダ意味論(VVC第7.4.8.2項)
スライスヘッダ構文要素slice_pic_order_cnt_lsbの値があれ
ば、コーディングされたピクチャのすべてのスライスヘッダにおいて同じである。
...
【0108】
【0109】
- sps_subpic_id_signalling_present_flag
が1に等しい場合、slice_subpic_idの長さはsps_subpic_i
d_len_minus1+1に等しい。
- そうでない場合、ph_subpic_id_signalling_prese
nt_flagが1に等しい場合、slice_subpic_idの長さはph_su
bpic_id_len_minus1+1に等しい。
- そうでない場合、pps_subpic_id_signalling_pres
ent_flagが1に等しい場合、slice_subpic_idの長さはpps_
subpic_id_len_minus1+1に等しい。
- そうでない場合、slice_subpic_idの長さは、Ceil(Log2
(sps_num_subpics_minus1+1))に等しい。
【0110】
【0111】
- スライスアドレスは、ラスタスキャンタイルインデックスである。
- slice_addressの長さは、Ceil(Log2(NumTilesI
nPic))ビットである。
- slice_addressの値は、0からNumTilesInPic-1まで
の範囲内にあるべきである。
そうでない場合(rect_slice_flagが1に等しい場合)、以下が適用さ
れる。
【0112】
【0113】
ビットストリーム適合性の要件は、以下の制約が適用されることである。
- rect_slice_flagが0に等しい、又はsubpics_prese
nt_flagが0に等しい場合、slice_addressの値は、同じコーディン
グされたピクチャにおいて任意の他のコーディングされたスライスNALユニットのsl
ice_addressの値に等しくてはならない。
- そうでない場合、slice_subpic_id及びslice_addres
s値の組は、同じコーディングされたピクチャにおいて任意の他のコーディングされたス
ライスNALユニットのslice_subpic_id及びslice_addres
s値の組に等しくてはならない。
【0114】
【0115】
6.2.第2の実施形態
本実施形態において、第1の実施形態に対して以下のような変更がなされる。
1)以下の制約は、一般的なスライスヘッダ意味論におけるように、除去される。
0~sps_num_subpics_minus1の範囲内における任意のiおよびj
について、iがjよりも小さい場合、SubpicIdList[i]はSubpicI
dList[j]よりも小さいとすることが、ビットストリーム適合性の要件である。
代替的に、この制約は取り除かれないままにされる。
【0116】
【0117】
【0118】
7.開示される技術の例示的な実装形態
図6は、映像処理装置600のブロック図である。装置600は、本明細書に記載の方
法の1つ以上を実装するために使用してもよい。装置600は、スマートフォン、タブレ
ット、コンピュータ、モノのインターネット(IoT)受信機等により実施されてもよい
。装置600は、1つ以上のプロセッサ602と、1つ以上のメモリ604と、映像処理
ハードウェア606と、を含んでもよい。プロセッサ(単数または複数)602は、本明
細書に記載される1つ以上の方法を実装するように構成されてもよい。メモリ(単数また
は複数)604は、本明細書で説明される方法および技術を実装するために使用されるデ
ータおよびコードを記憶するために使用してもよい。映像処理ハードウェア606は、本
明細書に記載される技術をハードウェア回路にて実装するために使用してもよい。
【0119】
図7は、本開示の技法を利用し得る例示的な映像コーディングシステム700を示すブ
ロック図である。
【0120】
図7に示すように、映像コーディングシステム700は、送信元デバイス710と、送
信先デバイス720と、を備えてもよい。送信元デバイス710は、映像符号化デバイス
とも称され得る符号化された映像データを生成する。送信先デバイス720は、映像復号
化デバイスと呼ばれ得る送信元デバイス710により生成され、符号化された映像データ
を復号化し得る。
【0121】
送信元デバイス710は、映像ソース712と、映像エンコーダ714と、入出力(I
/O)インターフェース716と、を備えてもよい。
【0122】
映像ソース712は、映像キャプチャデバイスなどのソース、映像コンテンツプロバイ
ダからの映像データを受信するためのインターフェース、および/または映像データを生
成するためのコンピュータグラフィックスシステム、またはこれらのソースの組み合わせ
たものを含んでもよい。映像データは、1つ以上のピクチャを含んでもよい。映像エンコ
ーダ714は、映像ソース712からの映像データを符号化し、ビットストリームを生成
する。ビットストリームは、映像データのコーディングされた表現を形成するビットのシ
ーケンスを含んでもよい。ビットストリームは、コーディングされたピクチャおよび関連
付けられたデータを含んでもよい。コーディングされたピクチャは、ピクチャのコーディ
ングされた表現である。関連付けられたデータは、シーケンスパラメータセット、ピクチ
ャパラメータセット、および他の構文構造を含んでもよい。I/Oインターフェース71
6は、変復調器(モデム)および/または送信機を含んでもよい。符号化された映像デー
タは、ネットワーク730aを介して、I/Oインターフェース716を経由して直接送
信先デバイス720に送信されることができる。符号化された映像データは、送信先デバ
イス720がアクセスするために、記憶媒体/サーバ730bに記憶してもよい。
【0123】
送信先デバイス720は、I/Oインターフェース726、映像デコーダ724、およ
び表示装置722を含んでもよい。
【0124】
I/Oインターフェース726は、受信機および/またはモデムを含んでもよい。I/
Oインターフェース726は、送信元デバイス710または記憶媒体/サーバ730bか
ら符号化映像データを取得してもよい。映像デコーダ724は、符号化された映像データ
を復号化してもよい。表示装置722は、復号化された映像データをユーザに表示しても
よい。表示デバイス722は、送信先デバイス720と一体化されてもよく、または外部
表示デバイスとインターフェースで接続するように構成される送信先デバイス720の外
部にあってもよい。
【0125】
映像エンコーダ714および映像デコーダ724は、高効率映像コーディング(HEV
C)規格、汎用映像コーディング(VVVM)規格、および他の現在のおよび/または将
来の規格等の映像圧縮規格に従って動作してもよい。
【0126】
図8は、映像エンコーダ800の一例を示すブロック図であり、この映像エンコーダ8
00は、
図7に示されるシステム700における映像エンコーダ714であってもよい。
【0127】
映像エンコーダ800は、本開示の技術のいずれか又は全部を実行するように構成され
てもよい。
図8の実施例において、映像エンコーダ800は、複数の機能モジュールを含
む。本開示で説明される技法は、映像エンコーダ800の様々なモジュール間で共有され
てもよい。いくつかの例では、プロセッサは、本開示で説明される技術のいずれかまたは
すべてを行うように構成してもよい。
【0128】
映像エンコーダ800の機能モジュールは、パーティションユニット801と、モード
選択ユニット803、動き推定ユニット804、動き補償ユニット805及びイントラ予
測ユニット806を含んでもよい予測ユニット802と、残差生成ユニット807と、変
換ユニット808と、量子化ユニット809と、逆量子化ユニット810と、逆変換ユニ
ット811と、再構成ユニット812と、バッファ813と、エントロピー符号化ユニッ
ト814とを含んでもよい。
【0129】
他の例において、映像エンコーダ800は、より多くの、より少ない、又は異なる機能
コンポーネントを含んでもよい。一例において、予測ユニット802は、イントラブロッ
クコピー(IBC)ユニットを含んでもよい。IBCユニットは、少なくとも1つの参照
ピクチャが現在の映像ブロックが位置するピクチャであるIBCモードにおいて予測を行
うことができる。
【0130】
さらに、動き推定ユニット804および動き補償ユニット805などのいくつかのコン
ポーネントは、高度に統合されてもよいが、説明のために、
図8の例においては個別に表
現されている。
【0131】
分割ユニット801は、1つのピクチャを1つ以上の映像ブロックに分割することがで
きる。映像エンコーダ800及び映像デコーダ900は、様々な映像ブロックサイズに対
応可能であってよい。
【0132】
モード選択ユニット803は、例えば、エラー結果に基づいて、イントラ又はインター
のいずれか1つのコーディングモードを選択し、結果として得られたイントラ又はインタ
ーコーディングされたブロックを、残差生成ユニット807に供給して残差ブロックデー
タを生成し、また再構成ユニット812に供給して参照ピクチャとして使用するために符
号化されたブロックを再構成してもよい。本発明の実施例において、モード選択ユニット
803は、インター予測信号およびイントラ予測信号に基づく予測を行うイントラおよび
インター予測(CIIP)モードの組み合わせを選択してもよい。また、モード選択ユニ
ット803は、インター予測の場合、ブロックのために動きベクトルの解像度(例えば、
サブピクセル又は整数ピクセル精度)を選択してもよい。
【0133】
現在の映像ブロックに対してインター予測を実行するために、動き推定ユニット804
は、バッファ813からの1つ以上の参照フレームと現在の映像ブロックとを比較するこ
とで、現在の映像ブロックのために動き情報を生成してもよい。動き補償ユニット805
は、現在の映像ブロックに関連付けられたピクチャ以外のバッファ813からのピクチャ
の動き情報及び復号化されたサンプルに基づいて、現在の映像ブロックのために予測映像
ブロックを判定してもよい。
【0134】
動き推定ユニット804及び動き補償ユニット805は、例えば、現在の映像ブロック
がIスライスであるか、Pスライスであるか、又はBスライスであるかに基づいて、現在
の映像ブロックに対して異なる演算を実行してもよい。
【0135】
いくつかの例において、動き推定ユニット804は、現在の映像ブロックに対して単方
向予測を実行し、動き推定ユニット804は、現在の映像ブロックに対して、リスト0又
はリスト7の参照ピクチャから、参照映像ブロックを検索してもよい。そして、動き推定
ユニット804は、参照映像ブロックと、現在の映像ブロックと参照映像ブロックとの間
の空間的変位を示す動きベクトルとを含む、リスト0またはリスト7における参照ピクチ
ャを示す参照インデックスを生成してもよい。動き推定ユニット804は、参照インデッ
クス、予測方向インジケータ、および動きベクトルを、現在の映像ブロックの動き情報と
して出力してもよい。動き補償ユニット805は、現在の映像ブロックの動き情報が示す
参照映像ブロックに基づいて、現在のブロックの予測映像ブロックを生成してもよい。
【0136】
他の例において、動き推定ユニット804は、現在の映像ブロックを双方向予測しても
よく、動き推定ユニット804は、リスト0における参照ピクチャの中から現在の映像ブ
ロックために参照映像ブロックを検索してもよく、また、リスト7における参照ピクチャ
の中から現在の映像ブロックのために別の参照映像ブロックを検索してもよい。そして、
動き推定ユニット804は、参照映像ブロックを含むリスト0およびリスト7における参
照ピクチャを示す参照インデックスと、参照映像ブロックと現在の映像ブロックとの間の
空間的変位を示す動きベクトルとを生成してもよい。動き推定ユニット804は、現在の
映像ブロックの参照インデックスおよび動きベクトルを、現在の映像ブロックの動き情報
として出力してもよい。動き補償ユニット805は、現在の映像ブロックの動き情報が示
す参照映像ブロックに基づいて、現在の映像ブロックの予測映像ブロックを生成してもよ
い。
【0137】
いくつかの例において、動き推定ユニット804は、デコーダの復号化処理のために、
動き情報のフルセットを出力してもよい。
【0138】
いくつかの例では、動き推定ユニット804は、現在の映像のために動き情報のフルセ
ットを出力しなくてもよい。むしろ、動き推定ユニット804は、別の映像ブロックの動
き情報を参照して、現在の映像ブロックの動き情報を信号通知してもよい。例えば、動き
推定ユニット804は、現在の映像ブロックの動き情報が近傍の映像ブロックの動き情報
に十分に類似していると判定してもよい。
【0139】
一例において、動き推定ユニット804は、現在の映像ブロックに関連付けられた構文
構造において、現在の映像ブロックが別の映像ブロックと同じ動き情報を有することを映
像デコーダ900に示す値を示してもよい。
【0140】
別の例において、動き推定ユニット804は、現在の映像ブロックに関連付けられた構
文構造において、別の映像ブロックと、動きベクトル差(MVD)とを識別してもよい。
動きベクトルの差分は、現在の映像ブロックの動きベクトルと、指定された映像ブロック
の動きベクトルとの差分を示す。映像デコーダ900は、指定された映像ブロックの動き
ベクトルと、動きベクトルの差分を用いて、現在の映像ブロックの動きベクトルを判定し
てもよい。
【0141】
上述したように、映像エンコーダ800は、動きベクトルを予測的に信号通知してもよ
い。実装され得る予測信号通知技術の2つの例は、
【0142】
映像エンコーダ800によって、高度動きベクトル予測(AMVP)およびマージモー
ド信号通知を含む。
【0143】
イントラ予測ユニット806は、現在の映像ブロックに対してイントラ予測を行っても
よい。イントラ予測ユニット806が現在の映像ブロックをイントラ予測する場合、イン
トラ予測ユニット806は、同一ピクチャにおける他の映像ブロックの復号化されたサン
プルに基づいて、現在の映像ブロックのための予測データを生成してもよい。現在の映像
ブロックのための予測データは、予測された映像ブロック及び様々な構文要素を含んでも
よい。
【0144】
残差生成ユニット807は、現在の映像ブロックから現在の映像ブロックの予測された
映像ブロックを減算することによって(例えば、マイナス符号によって示されている)、
現在の映像ブロックのために残差データを生成してもよい。現在の映像ブロックの残差デ
ータは、現在の映像ブロックにおけるサンプルの異なるサンプル成分に対応する残差映像
ブロックを含んでもよい。
【0145】
他の例において、例えば、スキップモードにおいて、現在の映像ブロックのための残差
データがなくてもよく、残差生成ユニット807は、減算演算を実行しなくてもよい。
【0146】
変換処理ユニット808は、現在の映像ブロックに関連付けられた残差映像ブロックに
1つ以上の変換を適用することによって、現在の映像ブロックのために1つ以上の変換係
数映像ブロックを生成してもよい。
【0147】
変換処理ユニット808が現在の映像ブロックに関連付けられた変換係数映像ブロック
を生成した後、量子化ユニット809は、現在の映像ブロックに関連付けられた1つ以上
の量子化パラメータ(QP)値に基づいて、現在の映像ブロックに関連付けられた変換係
数映像ブロックを量子化してもよい。
【0148】
逆量子化ユニット810および逆変換ユニット811は、変換係数映像ブロックに逆量
子化および逆変換をそれぞれ適用し、変換係数映像ブロックから残差映像ブロックを再構
成してもよい。再構成ユニット812は、予測ユニット802が生成した1つ以上の予測
映像ブロックから対応するサンプルに再構成された残差映像ブロックを加え、現在のブロ
ックに関連付けられた再構成映像ブロックを生成し、バッファ813に記憶することがで
きる。
【0149】
再構成ユニット812が映像ブロックを再構成した後、映像ブロックにおける映像ブロ
ッキングアーティファクトを縮小するために、ループフィルタリング動作を行ってもよい
。
【0150】
エントロピー符号化ユニット814は、映像エンコーダ800の他の機能コンポーネン
トからデータを受信してもよい。エントロピー符号化ユニット814がデータを受信した
場合、エントロピー符号化ユニット814は、1つ以上のエントロピー符号化演算を行い
、エントロピー符号化データを生成し、エントロピー符号化データを含むビットストリー
ムを出力してもよい。
【0151】
図9は、映像デコーダ900の一例を示すブロック図であり、この映像デコーダ900
は、
図7に示すシステム700における映像デコーダ714であってもよい。
【0152】
映像デコーダ900は、本開示の技術のいずれか又は全部を実行するように構成されて
もよい。
図9の実施例において、映像デコーダ900は、複数の機能コンポーネントを含
む。本開示で説明される技法は、映像デコーダ900の様々なコンポーネント間で共有さ
れてもよい。いくつかの例では、プロセッサは、本開示で説明される技術のいずれかまた
はすべてを行うように構成してもよい。
【0153】
図9の実施例において、映像デコーダ900は、エントロピー復号化ユニット901、
動き補償ユニット902、イントラ予測ユニット903、逆量子化ユニット904、逆変
換ユニット905、および再構成ユニット906、並びにバッファ907を含む。映像デ
コーダ900は、いくつかの例では、映像エンコーダ800(
図8)に関して説明した符
号化パスとほぼ逆の復号化パスを行ってもよい。
【0154】
エントロピー復号化ユニット901は、符号化されたビットストリームを取り出す。符
号化されたビットストリームは、エントロピーコーディングされた映像データ(例えば、
映像データの符号化されたブロック)を含んでもよい。エントロピー復号化ユニット90
1は、エントロピーコーディングされた映像データを復号化し、エントロピー復号された
映像データから、動き補償ユニット902は、動きベクトル、動きベクトル精度、参照ピ
クチャリストインデックス、および他の動き情報を含む動き情報を判定してもよい。動き
補償ユニット902は、例えば、AMVP及びマージモードを実行することで、このよう
な情報を判定してもよい。
【0155】
動き補償ユニット902は、動き補償されたブロックを生成してもよく、場合によって
は、補間フィルタに基づいて補間を実行してもよい。構文要素には、サブピクセルの精度
で使用される補間フィルタのための識別子が含まれてもよい。
【0156】
動き補償ユニット902は、映像ブロックの符号化中に映像エンコーダ80によって使
用されるような補間フィルタを使用して、参照ブロックのサブ整数ピクセルのための補間
値を計算してもよい。動き補償ユニット902は、受信された構文情報に基づいて、映像
エンコーダ800が使用する補間フィルタを決定し、この補間フィルタを使用して予測ブ
ロックを生成してもよい。
【0157】
動き補償ユニット902は、構文情報の一部を用いて、符号化された映像シーケンスの
フレーム(複数可)および/またはスライス(複数可)を符号化するために使用されるブ
ロックのサイズ、符号化された映像シーケンスのピクチャの各マクロブロックがどのよう
に分割されるかを記述する分割情報、各分割がどのように符号化されるかを示すモード、
インター符号化ブロック間の各1つ以上の参照フレーム(および参照フレームリスト)、
および符号化された映像シーケンスを復号化するための他の情報を判定してもよい。
【0158】
イントラ予測ユニット903は、例えば、ビットストリームにおいて受信したイントラ
予測モードを使用して、空間的に隣接するブロックから予測ブロックを形成してもよい。
逆量子化ユニット903は、ビットストリームに提供され、エントロピー復号化ユニット
901によって復号されることで、量子化された映像ブロック係数を逆量子化(すなわち
、逆量子化)する。逆変換ユニット903は、逆変換を適用する。
【0159】
再構成ユニット906は、残差ブロックと、動き補償ユニット802、又はイントラ予
測ユニット903によって生成された対応する予測ブロックとを合計し、復号化されたブ
ロックを生成してもよい。所望であれば、デブロッキングフィルタは、ブロック化された
アーティファクトを除去するために、復号化されたブロックをフィルタリングするため適
用されてもよい。復号化された映像ブロックは、バッファ907に記憶され、バッファ9
07は、後続の動き補償/イントラ予測のために参照ブロックを提供し、且つ、表示装置
に表示するために復号化された映像を生成する。
【0160】
図10は、本明細書で開示される様々な技術が実装され得る例示的な映像処理システム
1000を示すブロック図である。様々な実装形態は、システム1000のモジュールの
一部又は全部を含んでもよい。システム1000は、映像コンテンツを受信するための入
力ユニット1002を含んでもよい。映像コンテンツは、未加工又は非圧縮フォーマット
、例えば、8又は10ビットのマルチモジュール画素値で受信されてもよく、又は圧縮又
は符号化フォーマットで受信されてもよい。入力ユニット1002は、ネットワークイン
ターフェース、周辺バスインターフェース、又は記憶インターフェースを表してもよい。
ネットワークインターフェースの例は、イーサネット(登録商標)、パッシブ光ネットワ
ーク(PON)等の有線インターフェース、およびWi-Fi(登録商標)またはセルラ
ーインターフェース等の無線インターフェースを含む。
【0161】
システム1000は、本明細書に記載される様々なコーディング、又は符号化方法を実
装可能なコーディングコンポーネント1004を含んでもよい。コーディングモジュール
1004は、入力ユニット1002からの映像の平均ビットレートをコーディングモジュ
ール1004の出力に低減し、映像のコーディングされた表現を生成してもよい。従って
、このコーディング技術は、映像圧縮または映像コード変換技術と呼ばれることがある。
コーディングモジュール1004の出力は、コンポーネント1006によって表されるよ
うに、記憶されてもよいし、接続された通信を介して送信されてもよい。入力ユニット1
002において受信された、記憶された、又は通信された映像のビットストリーム(又は
コーディングされた)表現は、コンポーネント1008によって使用されて、表示インタ
ーフェースユニット1010に送信される画素値、又は表示可能な映像を生成してもよい
。ビットストリーム表現からユーザが見ることができる映像を生成する処理は、映像伸張
(映像展開)と呼ばれることがある。さらに、特定の映像処理操作を「コーディング」操
作又はツールと呼ぶが、コーディングツール又は操作は、符号化及びそれに対応する、コ
ーディングの結果を逆にする復号化ツール又は操作が、デコーダによって行われることが
理解されよう。
【0162】
周辺バスインターフェースまたは表示インターフェースの例は、ユニバーサルシリアル
バス(USB)または高精細マルチメディアインターフェース(HDMI(登録商標))
またはディスプレイポート等を含んでもよい。ストレージインターフェースの例は、シリ
アルアドバンスドテクノロジーアタッチメント(SATA)、PCI、IDEインターフ
ェース等を含む。本明細書に記載される技術は、携帯電話、ノートパソコン、スマートフ
ォン、又はデジタルデータ処理及び/又は映像表示を実施可能な他のデバイス等の様々な
電子デバイスに実施されてもよい。
【0163】
以上、説明の目的で本開示の技術の特定の実施形態を説明したが、本発明の範囲から逸
脱することなく様々な修正が可能であることは、理解されるであろう。従って、本開示の
技術は、添付の特許請求の範囲による場合を除き、限定されない。
【0164】
本特許明細書に記載された主題および機能操作の実装形態は、本明細書に開示された構
造およびその構造的等価物を含め、様々なシステム、デジタル電子回路、またはコンピュ
ータソフトウェア、ファームウェア、若しくはハードウェアで実施されてもよく、または
それらの1つ以上の組み合わせで実施してもよい。本明細書に記載された主題の実装形態
は、1つ以上のコンピュータプログラム製品、すなわち、データ処理装置によって実行さ
れるため、又はデータ処理装置の操作を制御するために、有形で非可搬性のコンピュータ
可読媒体上に符号化されたコンピュータプログラム命令の1つ以上のモジュールとして実
装することができる。このコンピュータ可読媒体は、機械読取可能な記憶装置、機械読取
可能な記憶基板、メモリデバイス、機械読取可能な伝播信号をもたらす物質の組成物、又
はこれらの1つ以上の組み合わせであってもよい。「データ処理ユニット」又は「データ
処理装置」という用語は、例えば、プログラマブルプロセッサ、コンピュータ、又は複数
の処理装置若しくはコンピュータを含め、データを処理するためのすべての装置、デバイ
ス、および機械を含む。この装置は、ハードウェアの他に、当該コンピュータプログラム
の実行環境を作るコード、例えば、プロセッサファームウェア、プロトコルスタック、デ
ータベース管理システム、オペレーティングシステム、またはこれらの1つ以上の組み合
わせを構成するコードを含むことができる。
【0165】
コンピュータプログラム(プログラム、ソフトウェア、ソフトウェアアプリケーション
、スクリプト、またはコードとも呼ばれる)は、コンパイルされた言語または解釈された
言語を含む任意の形式のプログラミング言語で記述することができ、また、それは、スタ
ンドアロンプログラムとして、またはコンピューティング環境で使用するのに適したモジ
ュール、コンポーネント、サブルーチン、または他のユニットとして含む任意の形式で展
開することができる。コンピュータプログラムは、必ずしもファイルシステムにおけるフ
ァイルに対応するとは限らない。プログラムは、他のプログラムまたはデータを保持する
ファイルの一部(例えば、マークアップ言語文書に格納された1つ以上のスクリプト)に
記録されていてもよいし、当該プログラム専用の単一のファイルに記憶されていてもよい
し、複数の調整ファイル(例えば、1つ以上のモジュール、サブプログラム、またはコー
ドの一部を格納するファイル)に記憶されていてもよい。1つのコンピュータプログラム
を、1つのサイトに位置する1つのコンピュータ、または複数のサイトに分散され通信ネ
ットワークによって相互接続される複数のコンピュータで実行させるように展開すること
も可能である。
【0166】
本明細書に記載された処理およびロジックフローは、入力データ上で動作し、出力を生
成することによって機能を実行するための1つ以上のコンピュータプログラムを実行する
1つ以上のプログラマブルプロセッサによって行うことができる。処理およびロジックフ
ローはまた、特定用途のロジック回路、例えば、FPGA(フィールドプログラマブルゲ
ートアレイ)またはASIC(特定用途向け集積回路)によって行うことができ、装置は
また、特別目的のロジック回路として実装することができる。
【0167】
コンピュータプログラムの実行に適したプロセッサは、例えば、汎用および専用マイク
ロプロセッサの両方、並びに任意の種類のデジタルコンピュータの任意の1つ以上のプロ
セッサを含む。一般的に、プロセッサは、読み出し専用メモリ又はランダムアクセスメモ
リ又はその両方から命令及びデータを受信する。コンピュータの本質的な要素は、命令を
実行するためのプロセッサと、命令およびデータを記憶するための1つ以上の記憶装置と
である。一般的に、コンピュータは、データを記憶するための1つ以上の大容量記憶デバ
イス、例えば、磁気、光磁気ディスク、または光ディスクを含んでもよく、またはこれら
の大容量記憶デバイスからデータを受信するか、またはこれらにデータを転送するように
動作可能に結合されてもよい。しかしながら、コンピュータは、このようなデバイスを有
する必要はない。コンピュータプログラム命令およびデータを記憶するのに適したコンピ
ュータ可読媒体は、あらゆる形式の不揮発性メモリ、媒体、およびメモリデバイスを含み
、例えば、EPROM、EEPROM、フラッシュメモリデバイス等の半導体メモリデバ
イスを含む。プロセッサおよびメモリは、特定用途のロジック回路によって補完されても
よく、または特定用途のロジック回路に組み込まれてもよい。
【0168】
いくつかの実施形態を、以下の項に基づくフォーマットを使用して説明することができ
る。以下の項目は、前章に記載された技術の例示的な実施形態を示す。
【0169】
A1.現在の映像セグメントと、複数の映像コーディング層(VCL)ネットワーク抽
象化層(NAL)ユニットを含む前記映像のビットストリーム表現との間での変換につい
て、前記現在の映像セグメントを含むスライスのスライスモードが矩形スライスモードで
あることを決定することと、前記決定に基づいて、前記変換を行うことを含み、前記ビッ
トストリーム表現は、前記複数の前記VCL NALユニットの復号順を信号通知する1
つ以上の構文要素をさらに含む、映像処理方法。
【0170】
A2-1.前記復号順は、前記複数の前記VCL NALユニットを含むサブピクチャ
のサブピクチャID値を昇順に含む、項目A1に記載の方法。
【0171】
A2-2.前記復号順は、昇順に並べられた前記複数の前記VCL NALユニットの
サブピクチャレベルのスライスインデックス値を含む、項目A1に記載の方法。
【0172】
A3-1.前記復号順は、昇順に並べられた前記複数のVCL NALユニットを含む
サブピクチャのサブピクチャインデックス値を含む、項目A1に記載の方法。A3-2.
前記サブピクチャレベルのスライスインデックス値の1つは、スライスヘッダにおけるs
lice_address構文要素の値である、項目A1に記載の方法。
【0173】
A4.前記ビットストリーム表現が前記slice_subpic_idパラメータを
排除すると判定された場合、slice_subpic_idパラメータの値がゼロであ
ると推測される、項目A1~A3のいずれかに記載の方法。
【0174】
A5.前記サブピクチャID値は、前記サブピクチャインデックス値とともに単調に増
加する、項目A2およびA3に記載の方法。
【0175】
A6.前記変換は、前記ビットストリーム表現から前記現在の映像セグメントを生成す
る、項目A1~A5のいずれかに記載の方法。
【0176】
A7.前記変換は、現在の映像セグメントから前記ビットストリーム表現を生成する、
項目A1~A5のいずれかに記載の方法。
【0177】
A8.前記現在の映像セグメントが、現在のスライス、現在のブロック、現在のタイル
、又は現在のサブピクチャである、項目A1~A7のいずれかに記載の方法。
【0178】
A9.項目A1~A8のずれか1項目以上に記載の方法を実装するように構成されたプ
ロセッサを備える映像処理装置。
【0179】
A10.コードを含むプログラムが記録され、前記プログラムが、プロセッサが項目A
1~A8のいずれか1つに記載の方法を実行するための、コンピュータ可読記録媒体。
【0180】
A11.非一時的なコンピュータ可読媒体に記憶されたコンピュータプログラム製品で
あって、項目A1~A8のいずれか1項に記載の方法を実行するためのプログラムコード
を含む、コンピュータプログラム製品。
【0181】
第2組の項目では、前章で開示された技術の特定の特徴及び態様を説明する。
【0182】
1.1つ以上のスライスを含む1つ以上のサブピクチャを含む映像と、規則に従った映
像のビットストリーム表現との間で変換を行うこと1110を含み、前記ビットストリー
ム表現は、多数のコーディングされたユニットを含み、前記規則は、サブピクチャ内のコ
ーディングされたユニットの復号順が、昇順に並べられた前記コーディングされたユニッ
トのサブピクチャレベルのスライスインデックス値である、ことを規定する、映像処理方
法(例えば、
図11に示す方法1100)。
【0183】
2.前記コーディングされたユニットは、映像コーディングされた層(VCL)ネット
ワーク抽象化層(NAL)ユニットに対応する、請求項1に記載の方法。
【0184】
3.前記規則は、スライスモードが矩形スライスモードである場合に適用される、請求
項1に記載の方法。
【0185】
4.サブピクチャレベルのスライスインデックス値は、スライスのスライスアドレスを
規定するスライスヘッダにおけるslice_address構文要素の値である、請求
項1に記載の方法。
【0186】
5.前記ビットストリーム表現がslice_subpic_idパラメータを排除す
ると決定されると、slice_subpic_idパラメータの値を推測する、請求項
1~4のいずれかに記載の方法。
【0187】
6.前記slice_subpic_idパラメータは、前記スライスを含む前記サブ
ピクチャのサブピクチャ識別(ID)を規定する、請求項5に記載の方法。
【0188】
7.前記決定時に、slice_subpic_idパラメータの値が0に等しいと推
測される、請求項5に記載の方法。
【0189】
8.前記複数のコーディングされたユニットを含むサブピクチャのサブピクチャID値
は、前記複数のコーディングされたユニットを含むサブピクチャのサブピクチャインデッ
クス値とともに単調に増加する、請求項1~7のいずれかに記載の方法。
【0190】
9.第1のスライスNAL(ネットワーク抽象化層)ユニットと第2のスライスNAL
ユニットを含むピクチャ内における前記コーディングされたユニットの復号順は、i)第
1のスライスNALユニットのサブピクチャレベルのスライスインデックス値が第2のス
ライスNALユニットのサブピクチャレベルのスライスインデックス値よりも小さい、又
は、ii)第1のスライスNALユニットのサブピクチャレベルのスライスインデックス
値が第2のスライスNALユニットのサブピクチャレベルのスライスインデックス値に等
しく、かつ、第1のスライスNALユニットのslice_adress構文要素の値が
第2のスライスNALユニットのslice_adress構文要素の値よりも小さい場
合、前記第1のスライスNALユニットが前記第2のスライスNALユニットに先行する
ように規定される、請求項5~7のいずれかに記載の方法。
【0191】
10.1つ以上のスライスを含む1つ以上のサブピクチャを含む映像と、規則に従った
映像のビットストリーム表現との間で変換を行うことを含み、前記ビットストリーム表現
は、多数のコーディングされたユニットを含み、前記規則は、コーディングされたユニッ
トの復号順を、前記コーディングされたユニットを含む前記1つ以上のサブピクチャから
、サブピクチャのサブピクチャ関連値の昇順にすることを規定する、映像処理方法。
【0192】
11.前記コーディングされたユニットは、映像コーディングされた層(VCL)ネッ
トワーク抽象化層(NAL)ユニットに対応する、請求項10に記載の方法。
【0193】
12.前記規則は、スライスモードが矩形スライスモードである場合に適用される、請
求項10に記載の方法。
【0194】
13.前記サブピクチャ関連値は、前記コーディングされたユニットを含むサブピクチ
ャの識別(ID)値に対応する、請求項10に記載の方法。
【0195】
14.前記サブピクチャ関連値は、前記コーディングされたユニットを含むサブピクチ
ャのサブピクチャインデックス値に対応する、請求項10に記載の方法。
【0196】
15.前記ビットストリーム表現がslice_subpic_idパラメータを排除
すると決定されると、slice_subpic_idパラメータの値を推測する、請求
項10~14のいずれかに記載の方法。
【0197】
16.前記決定時に、slice_subpic_idパラメータの値が0に等しいと
推測される、請求項15に記載の方法。
【0198】
17.前記コーディングされたユニットを含むサブピクチャのサブピクチャID値は、
前記複数のコーディングされたユニットを含むサブピクチャのサブピクチャインデックス
値とともに単調に増加する、請求項10~16のいずれかに記載の方法。
【0199】
18.前記変換は、前記映像を前記ビットストリーム表現に符号化することを含む、項
10~16のいずれかに記載の方法。
【0200】
19.前記変換は、前記ビットストリーム表現から前記映像を復号することを含む、項1
0~16のいずれかに記載の方法。
【0201】
20.請求項1~19のいずれか1項以上に記載の方法を実装するように構成されたプ
ロセッサを備える映像処理装置。
【0202】
21.実行されると、プロセッサに、請求項1から19のいずれか1つ以上に記載の方
法を実装させるプログラムコードを格納するコンピュータ読み取り可能媒体。
【0203】
22. 上述した方法のいずれかに従って生成されたコーディングされた表現またはビ
ットストリーム表現を記憶する、コンピュータ読み取り可能媒体。
【0204】
23.請求項1~19のいずれか1つ以上に記載の方法を実装するように構成された、
ビットストリーム表現を記憶するための映像処理装置。
【0205】
本特許明細書は多くの詳細を含むが、これらは、任意の発明の範囲又は特許請求の範囲
を限定するものと解釈されるべきではなく、むしろ、特定の発明の特定の実施形態に特有
であり得る特徴の説明と解釈されるべきである。本特許文献において別個の実施形態の文
脈で説明されている特定の特徴は、1つの例において組み合わせて実装してもよい。逆に
、1つの例のコンテキストで説明された様々な特徴は、複数の実施形態において別個にま
たは任意の適切なサブコンビネーションで実装してもよい。さらに、特徴は、特定の組み
合わせで作用するものとして上記に記載され、最初にそのように主張されていてもよいが
、主張された組み合わせからの1つ以上の特徴は、場合によっては、組み合わせから抜粋
されることができ、主張された組み合わせは、サブコンビネーションまたはサブコンビネ
ーションのバリエーションに向けられてもよい。
【0206】
同様に、動作は図面において特定の順番で示されているが、これは、所望の結果を達成
するために、このような動作が示された特定の順番でまたは連続した順番で行われること
、または示された全ての動作が行われることを必要とするものと理解されるべきではない
。また、本特許明細書に記載されている例における様々なシステムの構成要素の分離は、
全ての実施形態においてこのような分離を必要とするものと理解されるべきではない。
【0207】
いくつかの実装形態および例のみが記載されており、この特許文献に記載され図示され
ているコンテンツに基づいて、他の実施形態、拡張および変形が可能である。
【手続補正書】
【提出日】2023-12-06
【手続補正1】
【補正対象書類名】特許請求の範囲
【補正対象項目名】全文
【補正方法】変更
【補正の内容】
【特許請求の範囲】
【請求項1】
映像処理の方法であって、
規則に従って、1つまたは複数のスライスを含む1つまたは複数のサブピクチャを含む1つまたは複数のピクチャを含む映像と、前記映像のビットストリームとの間で変換を実行し、
前記ビットストリームは、いくつかのコーディングされたユニットを含み、
前記規則は、サブピクチャ内の前記コーディングされたユニットの復号順序が、前記コーディングされたユニットに対応するスライスのスライスアドレスを指定するスライスヘッダ内のslice_address構文要素の値の増加順序であることを指定する、
方法。
【請求項2】
前記コーディングされたユニットは、映像コーディング層(VCL)ネットワーク抽象化レイヤ(NAL)ユニットに対応する、
請求項1に記載の方法。
【請求項3】
スライスモードが矩形スライスモードである場合、スライスヘッダ内のslice_address構文要素の値がサブピクチャレベルのスライスインデックスに等しい、
請求項1~2のいずれかに記載の方法。
【請求項4】
前記サブピクチャレベルのスライスインデックスは、ピクチャパラメータセットでにおいて信号通知される前記順序で、サブピクチャ内のスライスのリストに対するスライスのインデックスを指定する、
請求項3に記載の方法。
【請求項5】
slice_subpic_idパラメータの値は、前記ビットストリームが前記slice_subpic_idパラメータを除外していると判定された場合に推定され、
前記slice_subpic_idパラメータは、前記スライスを含む前記サブピクチャのサブピクチャ識別(ID)を指定する、
請求項1~4のいずれかに記載の方法。
【請求項6】
前記slice_subpic_idパラメータの前記値は、前記決定時に0に等しいと推定される、
請求項5に記載の方法。
【請求項7】
前記コーディングされた前記いくつかのユニットを構成するサブピクチャのサブピクチャID値は、前記コーディングされた前記いくつかのユニットを構成するサブピクチャのサブピクチャインデックス値とともに単調増加する、
請求項1~6のいずれかに記載の方法。
【請求項8】
第1のスライスネットワーク抽象化レイヤ(NAL)ユニットと第2のスライスNALユニットとを含むピクチャ内のコーディングされたユニットの前記復号順序は、i)前記第1のスライスNALユニットのサブピクチャインデックス値が前記第2のスライスNALユニットのサブピクチャインデックス値より小さい場合、または、ii)前記第1のスライスNALユニットの前記サブピクチャインデックス値が前記第2のスライスNALユニットの前記サブピクチャインデックス値と等しく、かつ前記第1のスライスNALユニットの前記slice_address構文要素の値が前記第2のスライスNALユニットの前記slice_address構文要素の値より小さい場合に、前記第1のスライスNALユニットが前記第2のスライスNALユニットに先行するように指定される、
請求項1~7のいずれかに記載の方法。
【請求項9】
前記変換は、前記映像を前記ビットストリームに符号化することを含む、
請求項1~8のいずれかに記載の方法。
【請求項10】
前記変換は、前記映像を前記ビットストリームから復号することを含む、
請求項1~9のいずれかに記載の方法。
【請求項11】
プロセッサと、命令を有する非一過性メモリとを備え、映像データを処理する装置であって、前記命令は、前記プロセッサによる実行時に、前記プロセッサに、
規則に従って、1つまたは複数のスライスを含む1つまたは複数のサブピクチャを含む1つまたは複数のピクチャを含む映像と、前記映像のビットストリームとの間で変換を実行するステップと、
前記ビットストリームは、いくつかのコーディングされたユニットを含み、
前記規則は、サブピクチャ内のコーディングされたユニットの復号順序が、前記コーディングされたユニットに対応するスライスのスライスアドレスを指定するスライスヘッダ内のslice_address構文要素の値の増加順序であることを指定するステップと、を実行させる、
装置。
【請求項12】
プロセッサに以下を実行させる命令を記憶した非一過性のコンピュータ可読記憶媒体であって、
規則に従って、1つまたは複数のスライスを含む1つまたは複数のサブピクチャを含む1つまたは複数のピクチャを含む映像と、前記映像のビットストリームとの間で変換を実行し、
前記ビットストリームは、いくつかのコーディングされたユニットを含み、
前記規則は、サブピクチャ内のコーディングされたユニットの復号順序が、前記コーディングされたユニットに対応するスライスのスライスアドレスを指定するスライスヘッダ内のslice_address構文要素の値の増加順序であることを指定する、
非一過性のコンピュータ可読記憶媒体。
【請求項13】
映像のビットストリームを格納する方法であって、
規則に従って、1つまたは複数のスライスを含む1つまたは複数のサブピクチャを含む1つまたは複数のピクチャを含む映像と、前記映像の前記ビットストリームを生成し、
前記映像の前記ビットストリームを非一過性のコンピュータ可読記録媒体に格納し、
前記ビットストリームは、いくつかのコーディングされたユニットを含み、
前記規則は、サブピクチャ内のコーディングされたユニットの復号順序が、前記コーディングされたユニットに対応するスライスのスライスアドレスを指定するスライスヘッダ内のslice_address構文要素の値の増加順序であることを指定する、
方法。
【手続補正2】
【補正対象書類名】明細書
【補正対象項目名】0001
【補正方法】変更
【補正の内容】
【0001】
関連出願の相互参照
本出願は、2020年12月21日出願の国際特許出願第PCT/US2020/06
6356号の国内段階である日本特許出願第2022-537686号の分割出願であり
、2019年12月26日出願の米国特許仮出願第62/953812号および2019
年12月27日出願の米国特許仮出願第62/954375号の優先権および利益を適時
に主張する優先権および利益を適時に主張する。上記出願の開示全体は、本明細書の開示
の一部として参照により援用される。
【外国語明細書】