(19)【発行国】日本国特許庁(JP)
(12)【公報種別】特許公報(B2)
(11)【特許番号】
(24)【登録日】2024-04-30
(45)【発行日】2024-05-10
(54)【発明の名称】V-PCC用の仮想参照デコーダ
(51)【国際特許分類】
H04N 19/70 20140101AFI20240501BHJP
【FI】
H04N19/70
(21)【出願番号】P 2021577586
(86)(22)【出願日】2020-06-24
(86)【国際出願番号】 US2020039360
(87)【国際公開番号】W WO2020263981
(87)【国際公開日】2020-12-30
【審査請求日】2022-02-07
(32)【優先日】2019-06-27
(33)【優先権主張国・地域又は機関】US
【前置審査】
(73)【特許権者】
【識別番号】504161984
【氏名又は名称】ホアウェイ・テクノロジーズ・カンパニー・リミテッド
(74)【代理人】
【識別番号】110000877
【氏名又は名称】弁理士法人RYUKA国際特許事務所
(72)【発明者】
【氏名】ワン、イエ-クイ
(72)【発明者】
【氏名】チェン、ジアンレ
(72)【発明者】
【氏名】ヘンドリー、フヌ
【審査官】間宮 嘉誉
(56)【参考文献】
【文献】特表2016-526351(JP,A)
【文献】特開2019-41402(JP,A)
【文献】米国特許出願公開第2015/0358640(US,A1)
【文献】JANG, Euee S. et al.,Video-Based Point-Cloud-Compression Standard in MPEG: From Evidence Collection to Committee Draft [Standards in Nutshell],IEEE Signal Processing Magazine,IEEE,2019年04月26日,Vol.36, No.3,pp.118-123,[online],[retrieved on 2023-03-17],Retrieved on the Internet: <URL: https://ieeexplore.ieee.org/document/8700674>
【文献】DESHPANDE, Sachin et al.,An Improved Hypothetical Reference Decoder for HEVC,Proc. Visual Information Processing and Communication IV,SPIE,2013年02月21日,Vol.8666,pp.1-9,[online],[retrieved on 2023-03-16],Retrieved from the Internet: <URL: https://www.spiedigitallibrary.org/proceedings/Download?urlId=10.1117%2F12.2009907>
【文献】WEBB, Jennifer L. H.,HRD Conformance for Real-Time H.264 Video Encoding,Proc. IEEE International Conference on Image Processing 2007,IEEE,2007年11月12日,Vol.V,pp.305-308,[online],[retrieved on 2023-03-17],Retrieved from the Internet: <URL: https://ieeexplore.ieee.org/stamp/stamp.jsp?tp=&arnumber=4379826>
【文献】GRAZIOSI, Danillo et al.,V-PCC Component Synchronization for Point Cloud Reconstruction,Proc. IEEE 22nd International Workshop on Multimedia Signal Processing 2020,IEEE,2020年12月16日,pp.1-5,[online],[retrieved on 2023-03-17],Retrieved from the Internet: <URL: https://ieeexplore.ieee.org/stamp/stamp.jsp?tp=&arnumber=9287092>
(58)【調査した分野】(Int.Cl.,DB名)
H04N 7/12
H04N 19/00-19/98
IEEE Xplore
(57)【特許請求の範囲】
【請求項1】
エンコーダにおいて実装される方法であって、前記方法は、
前記エンコーダのプロセッサが、バッファリング期間追加拡大情報(SEI)メッセージと、点群圧縮(PCC)成分のシーケンスと、仮想参照デコーダ(HRD)パラメータとを、ビットストリームに符号化する段階と、
前記プロセッサが、前記バッファリング期間SEIメッセージに関連付けられた符号化アトラスアクセスユニット(AU)においてHRDを、初期化する段階と、
前記プロセッサが、前記符号化アトラスAUにおいて開始する前記ビットストリームのHRD適合性チェックを実行する段階と、
を含み、
第1タイプの適合点が、前記HRDパラメータに基づいて選択されるとき、前記HRD適合性チェックが、解凍された属性成分上で、解凍されたアトラス成分上で、解凍された占有マップ成分上で、および前記PCC成分の解凍されたジオメトリ成分上で実行される、方法。
【請求項2】
エンコーダにおいて実装される方法であって、前記方法は、
前記エンコーダのプロセッサが、バッファリング期間追加拡大情報(SEI)メッセージと、点群圧縮(PCC)成分のシーケンスと、仮想参照デコーダ(HRD)パラメータとを、ビットストリームに符号化する段階と、
前記プロセッサが、前記バッファリング期間SEIメッセージに関連付けられた符号化アトラスアクセスユニット(AU)においてHRDを、初期化する段階と、
前記プロセッサが、前記符号化アトラスAUにおいて開始する前記ビットストリームのHRD適合性チェックを実行する段階と、
を含み、
第2タイプの適合点が、前記HRDパラメータに基づいて選択されるとき、前記HRD適合性チェックが前記PCC成分の再構成された点群上で実行される、方法。
【請求項3】
請求項1
又は2に記載の方法を実行するように構成されるプロセッサを含む、
ビデオ符号化デバイス。
【請求項4】
ビデオ符号化デバイスによって用いるためのコンピュータプログラムであって、コンピュータ実施可能な命令を備える前記コンピュータプログラムは、プロセッサによって実行されたとき、請求項1
又は2に記載の方法を前記ビデオ符号化デバイスに実行させる、コンピュータプログラム。
【請求項5】
バッファリング期間追加拡大情報(SEI)メッセージと、点群圧縮(PCC)成分のシーケンスと、仮想参照デコーダ(HRD)パラメータとを、ビットストリームに符号化する符号化手段と、
前記バッファリング期間SEIメッセージに関連付けられる符号化アトラスアクセスユニット(AU)においてHRDを初期化する初期化手段と、
前記符号化アトラスAUにおいて開始する前記ビットストリームのHRD適合性チェックを実行するHRD手段と、
デコーダに向けて通信するように前記ビットストリームを格納する格納手段と、
を含み、
第1タイプの適合点が、前記HRDパラメータに基づいて選択されるとき、前記HRD適合性チェックが、解凍された属性成分上で、解凍されたアトラス成分上で、解凍された占有マップ成分上で、および前記PCC成分の解凍されたジオメトリ成分上で実行される、エンコーダ。
【請求項6】
バッファリング期間追加拡大情報(SEI)メッセージと、点群圧縮(PCC)成分のシーケンスと、仮想参照デコーダ(HRD)パラメータとを、ビットストリームに符号化する符号化手段と、
前記バッファリング期間SEIメッセージに関連付けられる符号化アトラスアクセスユニット(AU)においてHRDを初期化する初期化手段と、
前記符号化アトラスAUにおいて開始する前記ビットストリームのHRD適合性チェックを実行するHRD手段と、
デコーダに向けて通信するように前記ビットストリームを格納する格納手段と、
を含み、
第2タイプの適合点が、前記HRDパラメータに基づいて選択されるとき、前記HRD適合性チェックが前記PCC成分の再構成された点群上で実行される、エンコーダ。
【発明の詳細な説明】
【技術分野】
【0001】
[関連出願の相互参照]
本特許出願は、Ye-Kui Wangによって2019年6月27日に出願された、「High-Level Syntax Improvements For Video-Based Point Cloud Compression」と題された米国仮特許出願第62/867,563号の利益を請求し、その全体が参照によって本明細書に組み込まれる。
【0002】
本開示は、概してビデオ符号化に関し、具体的には、ビデオ点群符号化(V-PCC)における仮想参照デコーダ(HRD)適合性検査をサポートするための改善に関する。
【背景技術】
【0003】
比較的短いビデオでさえも、その描画に必要とされるビデオデータの量は著しいものになる可能性があり、その結果、帯域幅容量の制限された通信ネットワークを介してデータをストリーミングするか、そうでなければ通信するときに困難が生じることがある。したがって、ビデオデータは概して、今日の遠隔通信ネットワークを介して通信される前に圧縮される。ビデオのサイズは、メモリリソースが限定的である場合があるので、ビデオが記憶デバイス上に格納される場合にもまた問題となり得る。ビデオ圧縮デバイスは、多くの場合、ソースにおけるソフトウェアおよび/またはハードウェアを用いて、伝送または記憶の前にビデオデータをコードし、これによりデジタルビデオイメージを表現するのに必要なデータの量を低下させる。次に、圧縮データは、デスティネーションにおいて、ビデオデータを復号するビデオ圧縮解除デバイスによって受信される。限定されたネットワークリソース、および、より高いビデオ品質へのますます増加する要求によって、画質の犠牲をほとんどまたは全く有さずに圧縮比を改善する、改善された圧縮および解凍技術が望ましい。
【発明の概要】
【課題を解決するための手段】
【0004】
一実施形態において、本開示は、エンコーダにおいて実装される方法を含み、方法は、エンコーダのプロセッサが、バッファリング期間追加拡大情報メッセージ(SEI)と、点群圧縮(PCC)成分のシーケンスとを、ビットストリームに符号化する段階と、プロセッサが、バッファリング期間SEIメッセージに関連付けられた符号化アトラスアクセスユニット(AU)において仮想参照デコーダ(HRD)を初期化する段階と、プロセッサが、符号化アトラスAUにおいて開始するビットストリームのHRD適合性チェックを実行する段階と、を含む。
【0005】
ビデオPCCは、様々な色の点の群によって表された3次元オブジェクトを効率的に符号化する機構である。点群は、経時的にキャプチャされ、PCC成分を含む。PCC成分は次に符号化される。時間の瞬間における群の各有効点のポジションは、ジオメトリフレームにおけるジオメトリマップとして格納される。色はパッチとして格納される。具体的には、時間の瞬間におけるパッチは、アトラスフレームとして圧縮される。パッチは、概して、アトラスフレーム全体を覆わない。それに応じて、アトラスフレームのどの部分がパッチデータを含むかを示す占有フレームが、また生成される。任意選択で、透過率など、点の属性が属性フレームに含まれてよい。したがって、各PCCフレームは、対応する瞬間における点群を説明する異なる構成要素を含む複数のフレームとして符号化され得る。さらに、異なる構成要素が、異なる符号化および復号(コーデック)システムを利用することによって符号化され得る。コーデックシステムは、仮想参照デコーダ(HRD)を利用してよい。HRDは、エンコーダにおいて動作する構成要素である。HRDは、符号化済みビットストリームを受信し、対応する符号化基準との適合性のためにビットストリームをチェックする。HRD適合性テスト/チェックにパスしたビットストリームは、符号化規格にもまた適合する任意のデコーダによって復号可能であるべきである。PCC成分を復号するように試みるときにHRDは相互運用性問題が生じることがあり、PCCシステムは、HRDを利用するように構成されなくてもよい。
【0006】
本例は、PCCシステムにおいてHRDを実装する機構を含む。エンコーダは、バッファリング期間SEIメッセージをビットストリームに符号化し得る。バッファリング期間SEIメッセージは、符号化されたアトラスフレームを含むAUに関連付けられる。したがって、HRDは初期化され、バッファリング期間SEIメッセージに基づいてアトラスフレームにおける適合性テストを始め得る。さらに、エンコーダは、HRDパラメータをビットストリームに符号化し得る。HRDパラメータは、実行される適合性テストのタイプを示し得る。タイプI適合性テストは、HRDが復号をチェックして、適合性に関して符号化PCCフレームの成分の各々をチェックすべきであることを示す。タイプII適合性テストは、HRDが様々な成分からの点群を完全に再構成して、適合性に関して再構成された点群をチェックすべきであることを示す。さらに、エンコーダは、アトラスフレームタイミングメッセージをビットストリームに符号化し得、それは、HRDにおける符号化されたアトラスバッファ(CAB)に関する遅延を示す。HRDは、予め定められた率でバッファから成分を除去するように、この情報を用い得る。HRDは次に、成分が予め定められた率でバッファから除去されるときに、HRDがバッファアンダーランまたはオーバーランなしに成分を復号することが可能であるかどうかの適合性を決定し得る。したがって、例は、PCCビデオ上でHRD適合性テストを初期化および動作させるために十分なデータを提供する。デコーダは次に、HRD適合性テストにパスした任意のPCCビデオを復号する。したがって、本例は、エンコーダおよびデコーダの両方におけるエラーを低減し、機能を増加する。さらに、本開示は符号化の効率を増加させる機構をサポートし、したがって、エンコーダおよび/またはデコーダにおけるプロセッサ、メモリ、および/またはネットワークリソース使用量の減少をサポートする。
【0007】
任意選択で、先行する態様のいずれかにおいて、態様の別の実装形態は、プロセッサが、仮想参照デコーダ(HRD)パラメータをビットストリームに符号化することをさらに備えることを、提供する。
【0008】
任意選択で、先行する態様のいずれかにおいて、態様の別の実装形態は、プロセッサが、HRDパラメータに基づいてHRDにおけるHRD適合性チェックに関する適合点を選択することをさらに備えることを、提供する。
【0009】
任意選択で、先行する態様のいずれかにおいて、態様の別の実装形態は、第1タイプの適合点が、HRDパラメータに基づいて選択されるとき、HRD適合性チェックが、解凍された属性成分上で、解凍されたアトラス成分上で、解凍された占有マップ成分上で、およびPCC成分の解凍されたジオメトリ成分上で実行されることを、提供する。
【0010】
任意選択で、先行する態様のいずれかにおいて、態様の別の実装形態は、第2タイプの適合点が、HRDパラメータに基づいて選択されるとき、HRD適合性チェックがPCC成分の再構成された点群上で実行されることを、提供する。
【0011】
任意選択で、先行する態様のいずれかにおいて、態様の別の実装形態は、プロセッサが、アトラスフレームタイミングSEIメッセージをビットストリームに符号化することをさらに備えることを、提供する。
【0012】
任意選択で、先行する態様のいずれかにおいて、態様の別の実装形態は、プロセッサが、アトラスフレームタイミングSEIメッセージによって指定されるように、HRD適合性チェックの最中にHRDにおいてCABから復号ユニットを除去することをさらに備えることを、提供する。
【0013】
任意選択で、先行する態様のいずれかにおいて、態様の別の実装形態はアトラスフレームタイミングSEIメッセージによって指定されたように、HRDにおける復号されたアトラスバッファ(DAB)の出力遅延を設定することをさらに備えることを、提供する。
【0014】
任意選択で、先行する態様のいずれかにおいて、態様の別の実装形態は、復号ユニットが、バッファリング期間SEIメッセージによって指定された初期遅延に基づいてHRD適合性チェックの最中にHRDにおけるCABから除去されることを、を提供する。
【0015】
一実施形態において、本開示は、デコーダにおいて実装される方法を含み、方法は、デコーダの受信機が、PCC成分の複数の符号化されたシーケンスおよびバッファリング期間SEIメッセージを含むビットストリームを受信する段階と、デコーダのプロセッサが、バッファリング期間SEIメッセージによって示される符号化アトラスアクセスユニットから開始するPCC成分を復号する段階と、を含む。
【0016】
ビデオPCCは、様々な色の点の群によって表される3次元オブジェクトを効率的に符号化する機構である。点群は、経時的にキャプチャされ、PCC成分に含まれる。PCC成分は、次に符号化される。時間の瞬間における群における各有効点のポジションは、ジオメトリフレームにおけるジオメトリマップとして格納される。色はパッチとして格納される。具体的には、時間の瞬間におけるパッチはアトラスフレームへ圧縮される。パッチは、概して、アトラスフレーム全体を覆わない。それに応じて、アトラスフレームのどの部分がパッチデータを含むかを示す占有フレームも、また生成される。任意選択で、透過率など、点の属性が属性フレームに含まれてよい。したがって、各PCCフレームは、対応する瞬間における点群を説明する異なる構成要素を含む複数のフレームとして符号化され得る。さらに、異なる構成要素は、異なる符号化および復号(コーデック)システムを利用することによって符号化され得る。コーデックシステムは、仮想参照デコーダ(HRD)を利用し得る。HRDはエンコーダにおいて動作する構成要素である。HRDは符号化済みビットストリームを受信し、対応する符号化基準との適合性のためにビットストリームをチェックする。HRD適合性テスト/チェックをパスしたビットストリームは、また、符号化規格に適合する任意のデコーダによって復号可能であるべきである。PCC成分を復号するように試みるときHRDは相互運用性問題を生じさせることがあり、PCCシステムは、HRDを利用するように構成されなくてもよい。
【0017】
本例は、PCCシステムにおいてHRDを実装する機構を含む。エンコーダは、バッファリング期間SEIメッセージをビットストリームに符号化し得る。バッファリング期間SEIメッセージは、符号化されたアトラスフレームを含むAUに関連付けられる。したがって、HRDは初期化され得、バッファリング期間SEIメッセージに基づいてアトラスフレームにおいて適合性テストを始め得る。さらに、エンコーダは、HRDパラメータをビットストリームに符号化し得る。HRDパラメータは、実行される適合性テストのタイプを示し得る。タイプI適合性テストは、HRDが復号をチェックして、適合性に関して符号化PCCフレームの成分の各々をチェックすべきであることを示す。タイプII適合性テストは、HRDが様々な成分からの点群を完全に再構成して、適合性に関して再構成された点群をチェックすべきであることを示す。さらに、エンコーダは、アトラスフレームタイミングメッセージをビットストリームに符号化し得、それは、HRDにおける符号化されたアトラスバッファ(CAB)に関する遅延を示す。HRDは、予め定められた率でバッファから成分を除去するように、この情報を用い得る。HRDは次に、成分が予め定められた率でバッファから除去されるときに、HRDがバッファアンダーランまたはオーバーランなしに成分を復号することが可能であるかどうかの適合性を決定し得る。したがって、例は、PCCビデオ上でHRD適合性テストを初期化および動作させるために十分なデータを提供する。デコーダは次に、HRD適合性テストにパスした任意のPCCビデオを復号する。したがって、本例は、エンコーダおよびデコーダの両方におけるエラーを低減し、機能を増加する。さらに、本開示は符号化の効率を増加させる機構をサポートし、したがって、エンコーダおよび/またはデコーダにおけるプロセッサ、メモリ、および/またはネットワークリソース使用量の減少をサポートする。
【0018】
任意選択で、先行する態様のいずれかにおいて、態様の別の実装形態は、バッファリング期間SEIメッセージが、HRDにおいてCABから復号ユニットを除去するための初期遅延を含むことを提供する。
【0019】
任意選択で、先行する態様のいずれかにおいて、態様の別の実装形態は、ビットストリームがHRDパラメータをさらに含むことを提供する。
【0020】
任意選択で、先行する態様のいずれかにおいて、態様の別の実装形態は、HRDパラメータが、HRDにおけるHRD適合性チェックに関する適合点を指定することを提供する。
【0021】
任意選択で、先行する態様のいずれかにおいて、態様の別の実装形態は、HRD適合性チェックが、解凍されたPCC成分上、または再構成された点群上で実行されるかどうかを、適合点が示すことを提供する。
【0022】
任意選択で、先行する態様のいずれかにおいて、態様の別の実装形態は、ビットストリームがさらに、アトラスフレームタイミングSEIメッセージを含むことを提供する。
【0023】
任意選択で、先行する態様のいずれかにおいて、態様の別の実装形態は、アトラスフレームタイミングSEIメッセージが、HRDにおいてCABから復号ユニットを除去するためのパラメータを指定することを提供する。
【0024】
一実施形態において、本開示は、プロセッサ、プロセッサを含むビデオ符号化デバイス、プロセッサに結合される受信機、プロセッサに結合されるメモリ、およびプロセッサに結合される送信機を含み、プロセッサ、受信機、メモリおよび送信機は、任意の先行する態様に記載の方法を実行するように構成される。
【0025】
一実施形態において、本開示は、ビデオ符号化デバイスによって用いるためのコンピュータプログラム製品を含む非一時的コンピュータ可読媒体を含み、コンピュータ実施可能な命令を備えるコンピュータプログラム製品は、プロセッサによって実行されたとき、先行する態様のいずれかに記載の方法をビデオ符号化デバイスに実行させるように、非一時的コンピュータ可読媒体に格納される。
【0026】
一実施形態において、本開示はデコーダを含み、デコーダは、PCC成分の複数の符号化されたシーケンスと、バッファリング期間SEIメッセージとを含むビットストリームを受信する受信手段と、バッファリング期間SEIメッセージによって示される符号化アトラスアクセスユニットから開始するPCC成分を復号する復号手段と、表示のためにPCC成分から再構成された点群を転送する転送手段と、を含む。
【0027】
任意選択で、先行する態様のいずれかにおいて、態様の別の実装形態は、デコーダがさらに、先行する態様のいずれかに記載の方法を実行するように構成されることを提供する。
【0028】
一実施形態において、本開示はエンコーダを含み、エンコーダは、バッファリング期間SEIメッセージおよびPCC成分のシーケンスをビットストリームに符号化する符号化手段と、バッファリング期間SEIメッセージに関連付けられる符号化アトラスAUにおいてHRDを初期化する初期化手段と、符号化アトラスAUにおいて開始するビットストリームのHRD適合性チェックを実行するHRD手段と、デコーダに向けて通信するようにビットストリームを格納する格納手段と、を含む。
【0029】
任意選択で、先行する態様のいずれかにおいて、態様の別の実装形態はさらに、先行する態様のいずれかに記載の方法を実行するように構成されたエンコーダを提供する。
【0030】
明確にすることを目的に、前述の実施形態のうちのいずれか1つまたは複数は、本開示の範囲内の新たな実施形態を作成するために、その他の前述の実施形態のうちの任意の1つまたは複数と組み合わされてよい。
【0031】
これらの特徴および他の特徴は、添付図面および特許請求の範囲と共に、以下の詳細な説明からより明確に理解されるであろう。
【図面の簡単な説明】
【0032】
本開示のより完全な理解のために、添付図面および詳細な説明と関連した以下の簡単な説明についてここで参照し、類似の参照番号は類似の部分を表す。
【0033】
【
図1】ビデオ信号を符号化する例示的な方法のフローチャートである。
【0034】
【
図2】ビデオ符号化のための例示的な符号化および復号(コーデック)システムの概略図である。
【0035】
【
図3】例示的なビデオエンコーダを示す概略図である。
【0036】
【
図4】例示的なビデオデコーダを示す概略図である。
【0037】
【
図5】点群圧縮(PCC)機構に従って符号化され得る点群媒体の一例である。
【0038】
【0039】
【
図7A】パッチの設定に関連付けられる例示的な占有フレームを示す。
【0040】
【
図7B】パッチの設定に関連付けられる例示的な幾何フレームを示す。
【0041】
【
図7C】パッチの設定に関連付けられる例示的なアトラスフレームを示す。
【0042】
【0043】
【
図9】PCCビットストリーム上で適合性テストを実行するように構成される、例示的な仮想参照デコーダ(HRD)の概略図である。
【0044】
【
図10】HRD適合性テストをサポートするようにHRDを初期化する使用のための、例示的PCCビットストリームを示す概略図である。
【0045】
【
図11】例示的なビデオ符号化デバイスの概略図である。
【0046】
【
図12】HRD適合性テストをサポートするようにHRDを初期化する使用のための、PCCビットストリームを符号化する例示的な方法のフローチャートである。
【0047】
【
図13】成功したHRD適合性テストから得られたPCCビットストリームを復号する例示的な方法のフローチャートである。
【0048】
【
図14】HRD適合性テストをサポートするようにPCCビットストリームを符号化する例示的システムの概略図である。
【発明を実施するための形態】
【0049】
1または複数の実施形態に係る例示的な実装態様が以下に提供されるが、開示されたシステムおよび/または方法は、現時点で知られているのかまたは存在しているのかに関係なく、任意の数の技法を使用して実装されてよいことを最初に理解されたい。本開示は、本明細書において図示され説明される例示的な設計例および実装形態を含む、以下に示される例示的な実装態様、図面、および技法に決して限定されるべきではなく、添付の特許請求の範囲と共に、その均等物の全範囲内で修正されてよい。
【0050】
以下に挙げる用語は、本明細書と反対の文脈で用いられない限り、以下のように定められる。具体的には、次の定義は、本開示に追加の明確性を提供するように意図される。しかしながら、用語は、異なる状況においては異なるように説明されることがある。それに応じて、次の定義は、補足とみなされるべきであり、本明細書のそのような用語に関して提供された説明のいかなる他の定義を限定するようにもみなされるべきではない。
【0051】
エンコーダは、ビデオデータをビットストリームに圧縮するように、符号化処理を利用するように構成されるデバイスである。デコーダは、表示のためにビットストリームをビデオデータに再構成するように、復号処理を利用するように構成されたデバイスである。点群/点群表現は、3次元(3D)空間における点(例えば、サンプル)のグループであり、各点はポジション、色、および/または属性を含み得る。ビットストリームは、エンコーダおよびデコーダの間を伝送するように圧縮されたビデオデータを含むビットのシーケンスである。点群符号化(PCC)コンテキストにおいて、ビットストリームは符号化されたビデオ点群圧縮(V-PCC)成分のビットのシーケンスを含む。
【0052】
V-PCC成分(または、より一般的にはPCC成分)は、V-PCC点群に関連付けられた特定のタイプの、アトラスデータ、占有マップデータ、ジオメトリデータ、または属性データであり得る。アトラスは、3D空間における3D境界ボックスに対応する長方形枠に投影される2次元(2D)境界ボックス(パッチとしてもまた知られる)の集合体であってよく、各2D境界ボックス/パッチは、点群のサブセットを表す。占有マップは、アトラスにおける各サンプル位置に関して、そのポジションが点群表現における有効な3D点に対応するかどうかを、その値が示すアトラスに対応する2Dアレイであり得る。ジオメトリマップは、各パッチに関連付けられたジオメトリ情報のアグリゲーションを介して作成された2Dアレイであり得、ジオメトリ情報/データは、点群フレームに関連付けられたデカルト座標のセットであり得る。属性は、色、反射率、表面法線、タイムスタンプ、有形の身分証明書(ID)などの、点群における各点と任意選択で関連付けられたスカラまたはベクトル特性であり得る。特定の時間の瞬間に関連付けられたアトラスデータ、占有マップ、ジオメトリマップ、または属性の完全なセットは、それぞれ、アトラスフレーム、占有マップフレーム、ジオメトリフレーム、属性フレーム、と呼ばれ得る。アトラスデータ、占有マップデータ、ジオメトリデータ、または属性データは、点群の成分であり得、したがって、それぞれ、アトラス成分、占有マップ成分、ジオメトリ成分、および属性フレーム成分と呼ばれ得る。
【0053】
アクセスユニット(AU)は、特定の分類規則に従って互いに関連付けられ、ある特定の出力時間に関連する、ネットワーク抽象化層(NAL)ユニットのセットであり得る。符号化された成分は、ビットストリームに含まれるように圧縮されているデータであり得る。解凍された成分は、復号処理の一部として、またはHRD適合性テストの一部として再構成された、ビットストリームまたはサブビットストリームからのデータであり得る。HRDは、特定の制約との適合性を検証するように、符号化処理によって生み出されたビットストリームのばらつきをチェックするエンコーダ上で動作するデコーダモデルであり得る。HRD適合性テスト/チェックは、符号化済みビットストリームが規格に適合するかどうかを決定するためのテストであり得る。適合点は、解凍および/または再構成されたそのデータが規格に適合することを検証するように、HRDがHRD適合性チェックを実行する復号/再構築プロセスにおける点であり得る。HRDパラメータは、HRDの作動条件を初期化する、および/または定める、シンタックス要素であり得る。補足拡張情報(SEI)メッセージは、復号されたピクチャにおけるサンプルの値を決定すべく復号処理によって不要である情報を伝える特定の意味論を有する、シンタックス構造であり得る。バッファリング期間SEIメッセージは、HRDにおける符号化されたアトラスバッファ(CAB)に関する初期除去遅延を示すデータを含むSEIメッセージであり得る。アトラスフレームタイミングSEIメッセージは、CABに関する除去遅延と、HRDにおいて復号されたアトラスバッファ(DAB)に関する出力遅延とを示すデータを含むSEIメッセージであり得る。再構成された点群は、PCCビットストリームからのデータに基づいて生成された点群であり得る。再構成された点群は、PCCビットストリームに符号化された点群を近似すべきである。
【0054】
復号ユニットは、復号のためにバッファに格納されたビットストリームまたはサブビットストリームから符号化された成分であり得る。CABは、PCCビットストリーム適合性テストの最中に用いるための、符号化されたアトラスフレームを復号順に含む、HRDにおける先入れ先出しバッファであり得る。CAB除去遅延は、除去の前に成分がCABに残り得る、時間の量であり得る。初期CAB除去遅延は、除去の前にビットストリームまたはサブビットストリームにおける第1AUの成分がCABに残り得る、時間の量であり得る。DABは、PCCビットストリーム適合性テストの最中に用いるための、復号された/解凍されたアトラスフレームを復号順に含む、HRDにおける、先入れ先出しバッファであり得る。DAB出力遅延は、(例えば、再構成された点群の一部として)出力となる前に解凍された/復号された成分がDABに残り得る、時間の量であり得る。
【0055】
以下の頭字語が本明細書において用いられる。アクセスユニット(AU)、符号化された点群シーケンス(CPC)、復号パッチフレームバッファ(DPFB)、高レベルのシンタックス(HLS)、仮想参照デコーダ(HRD)、イントラランダムアクセス点(IRAP)、点群圧縮(PCC)、パルスコード変調(PCM)、パッチフレームオーダーカウント(PFOC)、パッチシーケンスパラメータセット(PSPS)、参照パッチフレームリスト(RPFL)、補足拡張情報(SEI)、シーケンスパラメータセット(SPS)、ビデオベースのPCC(V-PCC)。
【0056】
多くのビデオ圧縮技術が、データの最小損失でビデオファイルのサイズを低減するように利用され得る。例えば、映像圧縮技術は、映像シーケンスにおけるデータ冗長性を低減または除去するように、空間(例えば、イントラピクチャ)予測および/または一時的な(例えば、インターピクチャ)予測を実行することを含み得る。ブロックベースのビデオ符号化に関して、映像スライス(例えば、ビデオイメージまたはビデオイメージの部分)がビデオブロックに分割されてよく、それはまた、ツリーブロック、符号化木ブロック(CTB)、符号化木単位(CTU)、符号化単位(CU)、および/または符号化ノードと呼ばれることがある。ピクチャのイントラ符号化(I)されたスライスにおけるビデオブロックは、同じピクチャにおける隣接ブロックにおける参照サンプルに関する空間的予測を使用して符号化される。ピクチャのイントラ符号化された単方向予測(P)または双方向予測(B)のスライスにおけるビデオブロックは、同じピクチャにおける隣接ブロックの参照サンプルに関する空間的予測、または他の参照ピクチャにおける参照サンプルに関する時間的予測を利用して符号化され得る。ピクチャは、フレームおよび/またはイメージと呼ばれ得、参照ピクチャは、参照フレームおよび/または参照イメージと呼ばれ得る。空間的または時間的予測は、イメージブロックを表す予測ブロックをもたらす。残差データは、オリジナルイメージブロックと予測ブロックの間の画素差分を表す。それに応じて、インター符号化されたブロックは、予測ブロックを形成する参照サンプルのブロックを指す動きベクトル、および、符号化されたブロックと予測ブロックの間の差異を示す残差データに従って符号化される。イントラ符号化されたブロックは、イントラ符号化モードと残差データに従って符号化される。更なる圧縮に関して、残差データは画素領域から変換領域に変換される。これらは、残差変換係数をもたらし、それは量子化され得る。量子化変換係数は最初は二次元アレイで配列されてよい。量子化変換係数は、変換係数の一次元ベクトルを生み出すべくスキャンされ得る。エントロピー符号化は、より多くの圧縮さえ実現するように適用され得る。そのようなビデオ圧縮技術は、以下により詳細に論じられる。
【0057】
符号化済みビデオを確実にすることは、正確に復号することであり得、ビデオは、対応するビデオ符号化規格に従って符号化および復号される。ビデオ符号化規格には、国際電気通信連合(ITU)の電気通信標準化部門(ITU‐T) H.261、国際標準化機構(ISO)/国際電気標準会議(IEC)のモーションピクチャ専門家グループ(MPEG)-1パート2、ITU‐T H.262またはISO/IECのMPEG-2パート2、ITU-T H.263、ISO/IECのMPEG-4パート2、ITU‐T H.264またはISO/IEC MPEG-4パート10としても知られている高度ビデオ符号化(AVC)、およびITU‐T H.265またはMPEG-Hパート2としても知られている高効率ビデオ符号化(HEVC)が含まれる。AVCには、スケーラブルビデオ符号化(SVC)、多視点ビデオ符号化(MVC)、および多視点ビデオ符号化+深度(MVC+D)、並びに3次元(3D)のAVC(3D-AVC)などの拡張版が含まれる。HEVCには、スケーラブルHEVC(SHVC)、多視点HEVC(MV-HEVC)、および3D HEVC(3D-HEVC)などの拡張版が含まれる。ITU‐TおよびISO/IECのジョイントビデオエキスパートチーム(JVET)は、汎用ビデオ符号化(VVC)と呼ばれるビデオ符号化規格の開発を始めた。VVCは、作業案(WD)を含み、それは、JVET-N1001-v9およびJVET-N1002-v2を含み、それは、VVCならびにリファレンスソフトウェアの、アルゴリズムの説明ならびに符号化サイドの説明を提供する。
【0058】
ビデオ点群圧縮(V-PCC)は、様々な色の点の群によって表される3次元オブジェクトを効率的に符号化する機構である。具体的には、V-PCCは、そのような点群を映像シーケンスの一部として表示するために、符号化および/または復号のために利用される。点群は、経時的にキャプチャされ、PCCフレームに含まれる。PCCフレームはPCC成分に分割され、それは次に符号化される。時間の瞬間における群における各有効点のポジションは、ジオメトリフレームにおけるジオメトリマップとして格納される。色はパッチとして格納される。具体的には、時間の瞬間におけるパッチはアトラスフレームへ圧縮される。パッチは、概して、アトラスフレーム全体を覆わない。それに応じて、アトラスフレームのどの部分が有効なパッチデータを含むかを示す占有フレームも、また生成される。任意選択で、透過率、不透明度、および/または他のデータなど、点の属性が属性フレームに含まれてよい。したがって、各PCCフレームは、対応する瞬間における点群を説明する異なる構成要素を含む複数のフレームとして符号化され得る。さらに、異なる構成要素は、異なる符号化および復号(コーデック)システムを利用することによって符号化され得る。
【0059】
コーデックシステムはHRDを利用し得る。HRDはエンコーダにおいて動作する構成要素である。HRDは符号化済みビットストリームを受信し、対応する符号化基準との適合性のためにビットストリームをチェックする。HRD適合性テスト/チェックをパスしたビットストリームは、また、符号化規格に適合する任意のデコーダによって復号可能であるべきである。再構成された点群への再構成のためにPCC成分を復号するように試みるときHRDは相互運用性問題を生じさせることがあり、PCCシステムは、HRDを利用するように構成されなくてもよい。
【0060】
PCCシステムにおいてHRDを実装する機構が本明細書において開示される。エンコーダは、バッファリング期間SEIメッセージをPCCビットストリームに符号化し得る。バッファリング期間SEIメッセージは、符号化されたアトラスフレームを含むAUに関連付けられる。したがって、HRDは初期化され得、バッファリング期間SEIメッセージに基づいてアトラスフレームにおいて適合性テストを始め得る。さらに、エンコーダは、HRDパラメータをビットストリームに符号化し得る。HRDパラメータは、実行される適合性テストのタイプを示し得る。タイプI適合性テストは、HRD(または複数のHRD)が復号をチェックして、適合性に関して符号化PCCフレームの成分の各々をチェックすべきことを示す。タイプII適合性テストは、HRDが様々な成分からの点群を完全に再構成して、適合性に関して再構成された点群をチェックすべきであることを示す。さらに、エンコーダは、アトラスフレームタイミングメッセージをビットストリームに符号化し得、それは、HRDにおける符号化されたアトラスバッファ(CAB)に関する遅延を示す。HRDは、予め定められた率でバッファから成分を除去するように、この情報を用い得る。HRDは次に、成分が予め定められた率でバッファから除去されるときに、HRDがバッファアンダーランまたはオーバーランなしに成分を復号することが可能であるかどうかの適合性を決定し得る。したがって、例は、符号化された点群の映像シーケンスを含むPCCビットストリーム上でHRD適合性テストを初期化および動作させるために十分なデータを提供する。したがって、本開示は、エンコーダおよびデコーダの両方におけるエラーを低減し、機能を増加する。さらに、本開示は符号化の効率を増加させる機構をサポートし、したがって、エンコーダおよび/またはデコーダにおけるプロセッサ、メモリ、および/またはネットワークリソース使用量の減少をサポートする。
【0061】
図1は、ビデオ信号を符号化する例示的な動作方法100のフローチャートである。具体的には、ビデオ信号はエンコーダにおいて符号化される。符号化処理は、ビデオファイルサイズを低減するように、さまざまな機構を利用することによってビデオ信号を圧縮する。より小さいファイルサイズは、関連付けられた帯域幅オーバヘッドを低減させながら、圧縮されたビデオファイルをユーザに伝送することを可能にする。デコーダは次に、エンドユーザへの表示のために元のビデオ信号を再構成するように、圧縮されたビデオファイルを復号する。復号処理は概して、デコーダがビデオ信号を整合性をもって再構成可能となるように、符号化処理のミラー動作を行う。
【0062】
段階101において、ビデオ信号がエンコーダに入力される。例えば、ビデオ信号は、メモリに格納された非圧縮ビデオファイルであってよい。別の例として、ビデオファイルは、ビデオカメラなどのビデオキャプチャデバイスによってキャプチャされ、ビデオのライブストリーミングをサポートするように符号化されてよい。ビデオファイルは、オーディオ構成要素とビデオ要素の両方を含んでよい。ビデオ要素は、シーケンスで見られたときに、動きの視覚的印象を提示する、一連のイメージフレームを含む。フレームは、本明細書では輝度成分(または輝度サンプル)と呼ばれる光と、彩度成分(または色サンプル)と呼ばれる色の観点で表現される、画素を含む。いくつかの例において、フレームはまた、3次元ビューイングをサポートする深度値を含み得る。
【0063】
段階103において、ビデオはブロックに分割される。分割は、圧縮のために、各フレームにおける画素を正方形および/または矩形のブロックに細分割することを含む。例えば、高効率ビデオ符号化(HEVC)(H.265およびMPEG-H Part2としてもまた知られる)において、フレームはまず、符号化木単位(CTU)に分割され得、それは、予め定義されたサイズ(例えば、64ピクセル×64ピクセル)のブロックである。CTUは、輝度と彩度サンプルの両方を含む。符号化木は、CTUをブロックに分割するように利用され得、次に、さらなる符号化をサポートするコンフィギュレーションが実現されるまで、ブロックを再帰的に細分割してよい。例えば、フレームの輝度成分は、個々のブロックが比較的均質照明値を含むまで、細分割されてよい。さらに、フレームの彩度成分は、個々のブロックが比較的均質色値を含むまで、細分割されてよい。それに応じて、分割機構は、映像フレームのコンテンツに依存して変わる。
【0064】
段階105において、様々な圧縮機構が、段階103において分割されたイメージブロックを圧縮するように利用される。例えば、インター予測(inter-prediction)および/またはイントラ予測(intra-prediction)が利用されてよい。インター予測は、共通のシーンにおける物体は連続するフレームにおいて現れる傾向がある、という事実を利用するように設計される。それに応じて、参照フレームにおける物体を描画するブロックは、隣接フレームにおいて繰り返して表現される必要がない。具体的には、テーブルなどの物体は、複数のフレームにわたって一定の位置に残ることがある。したがって、テーブルが一度表現されると、隣接フレームは、参照フレームに戻って参照され得る。パターン適合性機構が、複数のフレームにわたって物体を適合させるように利用され得る。さらに、例えば物体の動きまたはカメラの動きに起因して、移動する物体は、複数のフレームにわたって表されることがある。特定の例として、ビデオが、複数のフレームにわたってスクリーンを横切って移動する自動車を示してよい。動きベクトルは、このような動きを表現するように利用され得る。動きベクトルは、フレームにおける物体の座標からの、参照フレームにおける物体の座標のオフセットを提供する二次元ベクトルである。したがって、インター予測は、現在のフレームにおけるイメージブロックを、参照フレームにおける対応するブロックからのオフセットを示す動きベクトルのセットとして、符号化し得る。
【0065】
イントラ予測は、共通フレームにおいてブロックを符号化する。イントラ予測は、輝度および彩度成分はフレームにおいてクラスタとなる傾向がある、という事実を利用する。例えば、木の部分における緑のパッチは、緑の同様のパッチに隣接してポジション決めされる傾向がある。イントラ予測は、複数の方向予測モード(例えば、HEVCにおいては33)、平面モード、および直流(DC)モードを利用する。方向性モードは、現在のブロックが、隣接ブロックのサンプルと、対応する方向において同様/同じであることを示す。平面モードは、行/列(例えば、平面)に沿った一連のブロックが、行の縁において隣接ブロックに基づいて補間され得ることを示す。平面モードは、実質的に、値を変更する際に比較的一定のスロープを利用することによって、行/列にわたる光/色の円滑な移行を示す。DCモードは、境界のスムージングに利用され、ブロックが、指向性予測モードの角度方向に関連付けられた全ての隣接ブロックのサンプルに関連付けられた平均値と、同様/同じであることを示す。それに応じて、イントラ予測ブロックは、実際の値の代わりに、様々な相関予測モード値としてイメージブロックを表し得る。さらに、インター予測ブロックは、実際の値の代わりに動きベクトル値としてイメージブロックを表し得る。どちらの場合も、予測ブロックは、いくつかの場合において、イメージブロックを正確に表さないことがある。いかなる差異も、残差ブロックに格納される。さらにファイルを圧縮するように、変換が、残差ブロックに適用され得る。
【0066】
段階107において、様々なフィルタリング技法が適用され得る。HEVCにおいて、フィルタはインループフィルタリングスキームに従って適用される。上記で論じられたブロックベースの予測は、デコーダにおいて、ブロックノイズのあるイメージを生成する結果となることがある。さらに、ブロック基数の予測スキームは、ブロックを符号化し得、次に、参照ブロックとして後で用いるための符号化済みブロックを再構成し得る。インループフィルタリングスキームは、ノイズ抑制フィルタ、ブロック解除フィルタ、適応ループフィルタ、およびサンプル適応オフセット(SAO)フィルタを、ブロック/フレームに繰り返し適用する。これらのフィルタは、エンコードされたファイルが正確に再構成され得るように、そのようなブロッキングアーチファクトを軽減する。さらに、再構築された参照ブロックに基づいて符号化された次のブロックにおいて、アーチファクトが追加のアーチファクトを作成する可能性が小さくなるように、これらのフィルタは再構築された参照ブロックへのアーチファクトを軽減する。
【0067】
一度ビデオ信号が分割、圧縮、およびフィルタリングされると、得られるデータは、段階109でビットストリームにおいて符号化される。ビットストリームは、上記で論じられたデータのみならず、デコーダにおいて正しいビデオ信号再構成をサポートするように要望される任意のシグナリングデータを含む。例えば、そのようなデータは、デコーダに符号化命令を提供する、分割データ、予測データ、残差ブロック、および様々なフラグを含み得る。ビットストリームは、要求時にデコーダに向けての伝送のために、メモリに格納され得る。ビットストリームはまた、複数のデコーダに向けてブロードキャストおよび/またはマルチキャストされ得る。ビットストリームの生成は反復プロセスである。それに応じて、段階101、103、105、107および109は、継続的および/または同時に、多くのフレームおよびブロックにわたって発生し得る。
図1に示された順序は明確および論議の容易性のために存在するものであり、ビデオ符号化処理を特定の順序に限定することを意図するものではない。
【0068】
デコーダは、ビットストリームを受信し、段階111で復号処理を始める。具体的には、デコーダは、ビットストリームを対応するシンタックスおよびビデオデータに変換するように、エントロピー復号スキームを利用する。段階111において、デコーダは、フレームに関する分割を決定するように、ビットストリームからのシンタックスデータを利用する。分割は、段階103において、ブロック分割の結果と適合すべきである。段階111において利用されるようなエントロピー符号化/復号が、ここで説明される。エンコーダは、圧縮処理の最中に、ブロック分割スキームの選択など、入力イメージの値の空間的位置に基づくいくつかの可能な選択から、多くの選択を行う。正確な選択のシグナリングは、多数のビン(bin)を利用し得る。本明細書で用いられるとき、ビンは、変数(例えば、コンテキストに依存して変わり得るビット値)として扱われる2進値である。エントロピー符号化は、エンコーダが、特定の場合において実行可能でないことが明確な任意の選択肢を棄却することを可能にし、許容可能な選択肢のセットを残す。各許容可能な選択肢は次に、符号語を割り当てられる。符号語の長さは、許容可能な選択肢(例えば、2つの選択肢に関して1つのビン、3から4つの選択肢に関して2つのビンなど)の数に基づく。エンコーダは次に、選択された選択肢に関する符号語を符号化する。符号語は、全ての可能な選択肢の大きい可能性のあるセットからの選択を一意的に示すのとは対照的に、許容可能な選択肢の小さいサブセットからの選択を一意的に示すように要望されるくらいの大きさなので、この方式は、符号語のサイズを低減する。デコーダは次に、エンコーダと同様の方式において許容可能な選択肢のセットを決定することによって、選択を復号する。許容可能な選択肢のセットを決定することによって、デコーダは、符号語を読み出し、エンコーダによって行われた選択を決定し得る。
【0069】
段階113において、デコーダはブロック復号を実行する。具体的には、デコーダは、残差ブロックを生成するように逆変換を利用する。次に、デコーダは、分割に従ってイメージブロックを再構成するように、残差ブロックおよび対応する予測ブロックを利用する。予測ブロックは、段階105においてエンコーダで生成されたようなイントラ予測ブロックおよびインター予測ブロックの両方を含み得る。再構成されたイメージブロックは次に、段階111において決定された分割データに従って再構成されたビデオ信号のフレームにポジション決めされる。段階113に関するシンタックスはまた、上記で論じられたようなエントロピー符号化を介して、ビットストリームにおいてシグナリングされ得る。
【0070】
段階115において、フィルタは、エンコーダにおいて段階107と同様の方式で、再構成されたビデオ信号のフレーム上で実行される。例えば、ノイズ抑制フィルタ、ブロック解除フィルタ、適応ループフィルタ、およびSAOフィルタが、ブロックアーチファクトを除去するようにフレームに適用され得る。一度フレームがフィルタリングされると、ビデオ信号は、エンドユーザが見るように、段階117においてディスプレイに出力され得る。
【0071】
図2は、ビデオ符号化のための例示的な符号化および復号(コーデック)システム200の概略図である。具体的には、コーデックシステム200は、方法100の動作の実装形態をサポートする機能を提供する。コーデックシステム200は、エンコーダおよびデコーダの両方で利用される成分を描画するように一般化される。コーデックシステム200は、動作方法100における段階101および103に関して論じられたように、ビデオ信号を受信および分割し、それは分割されたビデオ信号201をもたらす。コーデックシステム200は次に、方法100における段階105、107および109に関して論じられたように、エンコーダとして作用するときに、分割されたビデオ信号201を符号化されたビットストリームに圧縮する。デコーダとして作用するときに、コーデックシステム200は、動作方法100における段階111、113、115および117に関して論じられたように、ビットストリームから出力ビデオ信号を生成する。コーデックシステム200は、汎用コーダ制御構成要素211、変換スケーリングおよび量子化構成要素213、イントラピクチャ推定構成要素215、イントラピクチャ予測構成要素217、動き補償構成要素219、動き推定構成要素221、スケーリングおよび逆変換構成要素229、フィルタ制御分析構成要素227、インループフィルタ構成要素225、復号されたピクチャバッファ構成要素223、およびヘッダフォーマットおよびコンテキスト適応型バイナリ算術符号化(CABAC)構成要素231を含む。このような構成要素は、示されるように結合される。
図2において、黒い線は、符号化/復号されるデータの動きを示し、破線は、他の構成要素のオペレーションを制御する制御データの動きを示す。コーデックシステム200の構成要素は、全てエンコーダにおいて存在し得る。デコーダは、コーデックシステム200の構成要素のサブセットを含み得る。例えば、デコーダはイントラピクチャ予測構成要素217、動き補償構成要素219、スケーリングおよび逆変換構成要素229、インループフィルタ構成要素225、および復号されたピクチャバッファ構成要素223を含み得る。これらの構成要素がここで説明される。
【0072】
分割されたビデオ信号201は、符号化木によって画素のブロックに分割された、キャプチャされたビデオシーケンスである。符号化木は、画素のブロックを画素のより小さいブロックに細分割するように、様々なスプリットモードを利用する。これらのブロックは次に、より小さいブロックへとさらに細分割され得る。ブロックは、符号化木上のノードと呼ばれてよい。より大きい親ノードは、より小さい子ノードへと分割される。ノードが細分割される回数は、ノード/符号化木の深度と呼ばれる。分割されたブロックは、いくつかの場合において、符号化単位(CU)に含まれ得る。例えば、CUは、CUに関して対応するシンタックス命令に従う、輝度ブロック、赤い異なる彩度(Cr)ブロック、および青い異なる彩度(Cb)ブロックを含むCTUのサブ部分であり得る。スプリットモードは、ノードをそれぞれ2、3、または4の子ノードに分割するように利用される二分木(BT)、三分木(TT)、および四分木(QT)を含み得、それらは利用されるスプリットモードに依存して様々な形状をとる。分割されたビデオ信号201は、圧縮のために、汎用コーダ制御構成要素211、変換スケーリングおよび量子化構成要素213、イントラピクチャ推定構成要素215、フィルタ制御分析構成要素227、および動き推定構成要素221へ転送される。
【0073】
汎用コーダ制御構成要素211は、用途制約に従って、映像シーケンスのイメージをビットストリームに符号化することに関する決定を行うように構成される。例えば、汎用コーダ制御構成要素211は、再構成品質に対する、ビットレート/ビットストリームサイズの最適化を管理する。このような決定は、格納空間/帯域幅有効性およびイメージ解像度要求に基づいて作成され得る。汎用コーダ制御構成要素211はまた、バッファアンダーランおよびオーバーラン問題を軽減するように、送信速度に鑑みバッファ利用を管理する。これらの問題を管理するように、汎用コーダ制御構成要素211は、分割、予測、および他の構成要素によるフィルタリングを管理する。例えば、汎用コーダ制御構成要素211は、解像度を増加させて帯域幅使用を増加させるように圧縮複雑性を動的に増加させることがあり、または、解像度および帯域幅使用を低下させるように圧縮複雑性を低下させることがある。したがって、汎用コーダ制御構成要素211は、ビデオ信号再構成品質とビットレート関連とのバランスをとるように、コーデックシステム200の他の構成要素を制御する。汎用コーダ制御構成要素211は制御データを作成し、それは他の構成要素の動作を制御する。制御データはまた、デコーダにおける復号のためのパラメータをシグナリングするように、ビットストリームに符号化されるヘッダフォーマットおよびCABAC構成要素231に転送される。
【0074】
分割されたビデオ信号201はまた、インター予測に関する動き推定構成要素221および動き補償構成要素219に送信される。分割されたビデオ信号201のフレームまたはスライスは、複数のビデオブロックに分割され得る。動き推定構成要素221および動き補償構成要素219は、受信されたビデオブロックのインター予測符号化を、1または複数の参照フレーム内の1または複数のブロックと比較することで実行し、時間的予測を提供する。コーデックシステム200は、複数の符号化パスを実行して、例えば、ビデオデータの各ブロックに適切な符号化モードを選択してよい。
【0075】
動き推定構成要素221および動き補償構成要素219は、高度に統合されてよいが、概念的な説明の目的で別々に示されている。動き推定構成要素221により実行される動き推定は、ビデオブロックの動きを推定する動きベクトルを生成する処理である。動きベクトルは、例えば、予測ブロックと比較して符号化されたオブジェクトの変位を示す。予測ブロックは、画素差分の観点から、符号化されるブロックに近い適合性があるとわかったブロックである。予測ブロックはまた、参照ブロックと呼ばれ得る。そのようなピクセル差は、絶対差の合計(SAD)、二乗差の合計(SSD)、または他の差分メトリクスによって決定され得る。HEVCは、CTU、符号化木ブロック(CTB)およびCUを含む、いくつかの符号化されたオブジェクトを利用する。例えば、CTUはCTBに分割され得、それは次に、CUに含まれるためのCBに分割され得る。CUは、予測データを含む予測ユニット(PU)および/または、CUに関して変換された残差データを含む変換ユニット(TU)として符号化され得る。動き推定構成要素221は、レート歪み最適化プロセスの一部としてレート歪み解析を使用して、動きベクトル、PU、およびTUを生成する。例えば、動き推定構成要素221は、現在のブロック/フレームに関する複数の参照ブロック、複数の動作ベクトルなどを決定し得、最良のレート歪み特性を有する参照ブロック、動きベクトルなどを選択し得る。最良のレート歪み特性は、ビデオ再構成の品質(例えば、圧縮によるデータ損失の量)、および符号化効率(例えば、最終的な符号化のサイズ)の両者をバランスさせる。
【0076】
いくつかの例において、コーデックシステム200は、復号されたピクチャバッファ構成要素223に格納された参照ピクチャのサブ整数ピクセル位置の値を計算してよい。例えば、ビデオコーデックシステム200は、参照ピクチャの4分の1ピクセル位置、8分の1ピクセル位置、または他の端数ピクセル位置の値を補間してよい。したがって、動き推定構成要素221は、フルピクセル位置および端数ピクセル位置に対して動き検索を実行し、端数ピクセル精度を有する動きベクトルを出力してよい。動き推定構成要素221は、インター符号化スライス内のビデオブロックのPUに対する動きベクトルを、PUのポジションと参照ピクチャの予測ブロックのポジションとを比較することで計算する。動き推定構成要素221は、符号化および動き補償構成要素219への動きのために、計算された動作ベクトルを動きデータとして、ヘッダフォーマットおよびCABAC構成要素231に出力する。
【0077】
動き補償構成要素219により実行される動き補償は、動き推定構成要素221により決定される動きベクトルに基づいて予測ブロックをフェッチするまたは生成することを必要とし得る。ここでも、動き推定構成要素221および動き補償構成要素219は、いくつかの例において機能的に統合されてよい。動き補償構成要素219は、現在のビデオブロックのPUに対する動きベクトルを受信すると、動きベクトルが示す予測ブロックの位置を特定してよい。残差ビデオブロックは次に、符号化された現在のビデオブロックの画素値から予測ブロックの画素値を減算することで形成され、ピクセル差分値を形成する。一般的に、動き推定構成要素221は、輝度成分に対して動き推定を実行し、動き補償構成要素219は輝度成分に基づいて計算された動きベクトルを彩度成分および輝度成分の両方に用いる。予測ブロックおよび残差ブロックは、変換スケーリングおよび量子化構成要素213に転送される。
【0078】
分割されたビデオ信号201はまた、イントラピクチャ推定構成要素215およびイントラピクチャ予測構成要素217に送信される。動き推定構成要素221および動き補償構成要素219と同様に、イントラピクチャ推定構成要素215およびイントラピクチャ予測構成要素217は高度に統合されてよいが、概念的目的で別々に示される。上記で説明されるように、フレーム間の動き推定構成要素221および動き補償構成要素219によって実行されるインター予測の代替手段として、イントラピクチャ推定構成要素215およびイントラピクチャ予測構成要素217は、現在のフレームにおけるブロックと比較して、現在のブロックをイントラ予測する。特に、イントラピクチャ推定構成要素215は、現在のブロックを符号化するように用いるイントラ予測モードを決定する。いくつかの例において、イントラピクチャ推定構成要素215は、現在のブロックを符号化するように、複数のテストされたイントラ予測モードから、適切なイントラ予測モードを選択する。選択されたイントラ予測モードは次に、符号化のために、ヘッダフォーマットおよびCABAC構成要素231に転送される。
【0079】
例えば、イントラピクチャ推定構成要素215は、様々なテスト済みイントラ予測モードに関して、レート歪み解析を使用してレート歪み値を計算し、テスト済みモードの中で最良のレート歪み特性を有するイントラ予測モードを選択してよい。レート歪み解析は概して、符号化済みブロックと、符号化済みブロックを生み出すために符号化されたオリジナルの符号化前のブロックとの間の歪み(またはエラー)の量、および符号化済みブロックを生み出すのに用いられるビットレート(例えば、ビット数)を決定する。イントラピクチャ推定構成要素215は、様々な符号化されたブロックの歪みおよびレートから比を計算し、どのイントラ予測モードが該当ブロックに対して最良のレート歪み値を示すかを決定してよい。さらに、イントラピクチャ推定構成要素215は、レート歪み最適化(RDO)に基づいて深度モデリングモード(DMM)を使用して、深度マップの深度ブロックを符号化するように構成されてよい。
【0080】
イントラピクチャ予測構成要素217は、エンコーダ上で実装されるとき、イントラピクチャ推定構成要素215によって決定される選択されたイントラ予測モードに基づいて予測ブロックから残差ブロックを生成し、または、デコーダ上で実装されるとき、ビットストリームから残差ブロックを読み出す。残差ブロックは、行列として表されるように、予測ブロックと元のブロックの間の値の差異を含む。残差ブロックは次に、変換スケーリングおよび量子化構成要素213に転送される。イントラピクチャ推定構成要素215およびイントラピクチャ予測構成要素217は、輝度および彩度成分の両方において動作し得る。
【0081】
変換スケーリングおよび量子化構成要素213は、さらに残差ブロックを圧縮するように構成される。変換スケーリングおよび量子化構成要素213は、離散余弦変換(DCT)、離散正弦変換(DST)または概念的に同様の変換などの変換を残差ブロックに適用して、残差変換係数値を含むビデオブロックを生み出す。ウェーブレット変換、整数変換、サブバンド変換、または他のタイプの変換もまた用いられる可能性がある。この変換は、画素値領域からの残差情報を、周波数領域などの変換領域に変換してよい。変換スケーリングおよび量子化構成要素213は、また、例えば周波数に基づいて、変換された残差情報をスケーリングするように構成される。そのようなスケーリングは、異なる周波数情報を異なる粒度で量子化するように、スケール因子を残差情報に適用することを含み、それは再構成済み映像の最終視覚的品質に影響し得る。変換スケーリングおよび量子化構成要素213はまた、ビットレートをさらに低減するように、変換係数を量子化するように構成される。量子化プロセスは、いくつかの、または全ての係数に関連付けられたビット深度を低減し得る。量子化の程度は、量子化パラメータを調整することによって修正され得る。いくつかの例において、変換スケーリングおよび量子化構成要素213は次に、量子化変換係数を含む行列のスキャンを実行し得る。量子化変換係数は、ビットストリームで符号化されるように、ヘッダフォーマットおよびCABAC構成要素231に転送される。
【0082】
スケーリングおよび逆変換構成要素229は、動き推定をサポートするように、変換スケーリングおよび量子化構成要素213の逆動作を適用する。スケーリングおよび逆変換構成要素229は、例えば、別の現在のブロックに関する予測ブロックとなり得る参照ブロックとして後で用いるために、画素領域における残差ブロックを再構成するように、逆スケーリング、変換、および/または量子化を適用する。動き推定構成要素221および/または動き補償構成要素219は、より後のブロック/フレームの動き推定を用いるように、残差ブロックを対応する予測ブロックに戻して加えることにより、参照ブロックを計算し得る。フィルタは、スケーリング、量子化、および変換の最中に生成したアーチファクトを軽減するように、再構築された参照ブロックに適用される。そうでない場合は、そのようなアーチファクトは、次のブロックが予測されるとき、不正確な予測を生じさせる(および、追加のアーチファクトを生成させる)であろう。
【0083】
フィルタ制御分析構成要素227およびインループフィルタ構成要素225は、残差ブロックおよび/または再構成されたイメージブロックへのフィルタを適用する。例えば、オリジナルイメージブロックを再構成するように、スケーリングおよび逆変換構成要素229から変換された残差ブロックは、イントラピクチャ予測構成要素217および/または動き補償構成要素219からの対応する予測ブロックと組み合され得る。フィルタは次に、再構成されたイメージブロックに適用され得る。いくつかの例において、フィルタは、代わりに、残差ブロックに適用され得る。
図2における他の構成要素と同様に、フィルタ制御分析構成要素227およびインループフィルタ構成要素225は高度に統合され、一緒に実装されてよいが、概念的目的で別々に描画される。再構築された参照ブロックに適用されるフィルタは、特定の空間領域に適用され、そのようなフィルタがどのように適用されるかを調整するように、複数のパラメータを含む。フィルタ制御分析構成要素227は、そのようなフィルタがどこで適用されるべきか決定するように、再構築された参照ブロックを分析し、対応するパラメータを設定する。そのようなデータは、符号化のためにフィルタ制御データとしてヘッダフォーマットおよびCABAC構成要素231に転送される。インループフィルタ構成要素225は、フィルタ制御データに基づいて、そのようなフィルタを適用する。フィルタは、非ブロック化フィルタ、ノイズ抑制フィルタ、SAOフィルタ、および適応ループフィルタを含んでよい。そのようなフィルタは、例に依存して、空間/ピクセル領域において(例えば、再構成された画素ブロック上で)、または、周波数領域において、適用されてよい。
【0084】
エンコーダとして動作するとき、フィルタリングされた再構成イメージブロック、残差ブロック、および/または予測ブロックは、上記で論じられる動き推定において後で用いるために、復号されたピクチャバッファ構成要素223に格納される。デコーダとして動作するとき、復号されたピクチャバッファ構成要素223は、再構成およびフィルタリングされたブロックを格納し、出力ビデオ信号の一部として、ディスプレイに向けて転送する。復号されたピクチャバッファ構成要素223は、予測ブロック、残差ブロック、および/または再構成されたイメージブロックを格納できる、任意のメモリデバイスであってよい。
【0085】
ヘッダフォーマットおよびCABAC構成要素231は、コーデックシステム200の様々な成分からデータを受信し、そのようなデータを、デコーダに向けて伝送するために、符号化されたビットストリームへ符号化する。具体的には、ヘッダフォーマットおよびCABAC構成要素231は、全体制御データおよびフィルタ制御データなどの制御データを符号化するように、様々なヘッダを生成する。さらに、イントラ予測および動きデータを含む予測データ、ならびに、量子化変換係数データの形式の残差データは、全てビットストリームにおいて符号化される。最終ビットストリームは、オリジナルの分割されたビデオ信号201を再構成するためにデコーダによって要望される全ての情報を含む。そのような情報は、また、イントラ予測モードインデックステーブル(また、符号語マッピングテーブルと呼ばれる)、様々なブロックに関する符号化コンテキストの定義、最も可能性が高いイントラ予測モードのインジケーション、分割情報のインジケーションなどを含んでよい。そのようなデータは、エントロピー符号化を利用することによって符号化されてよい。例えば、情報は、コンテキスト適応型変数長符号化(CAVLC)、CABAC、シンタックスベースのコンテキスト適応型バイナリ算術符号化(SBAC)、確率区間区分エントロピー(PIPE)符号化、または別のエントロピー符号化技法を利用して符号化されてよい。エントロピー符号化に続いて、符号化されたビットストリームは、別のデバイス(例えば、ビデオデコーダ)に伝送されても、後の伝送または検索のためにアーカイブされてもよい。
【0086】
図3は、例示的なビデオエンコーダ300を示すブロック図である。ビデオエンコーダ300は、コーデックシステム200の符号化機能を実装するように、および/または、動作方法100の段階101、103、105、107および/または109を実装するように、利用され得る。エンコーダ300は入力されるビデオ信号を分割し、分割されたビデオ信号301をもたらし、それは実質的、分割されたビデオ信号201と同様となる。分割されたビデオ信号301は次に、エンコーダ300の構成要素によって圧縮され、ビットストリームに符号化される。
【0087】
具体的には、分割されたビデオ信号301は、イントラ予測のために、イントラピクチャ予測構成要素317に転送される。イントラピクチャ予測構成要素317は、イントラピクチャ推定構成要素215およびイントラピクチャ予測構成要素217と実質的に同様であってよい。分割されたビデオ信号301はまた、復号されたピクチャバッファ構成要素323における参照ブロックに基づいて、インター予測のために動き補償構成要素321に転送される。動き補償構成要素321は、動き推定構成要素221および動き補償構成要素219と実質的に同様であってよい。イントラピクチャ予測構成要素317および動き補償構成要素321からの予測ブロックおよび残差ブロックは、残差ブロックの変換および量子化のために、変換および量子化構成要素313に転送される。変換および量子化構成要素313は、変換スケーリングおよび量子化構成要素213と実質的に同様であってよい。変換および量子化された残差ブロック、および対応する予測ブロック(関連付けられた制御データと共に)は、ビットストリームに符号化するために、エントロピー符号化構成要素331に転送される。エントロピー符号化構成要素331は、ヘッダフォーマットおよびCABAC構成要素231と実質的に同様であってよい。
【0088】
変換および量子化された残差ブロック、および/または対応する予測ブロックはまた、変換および量子化構成要素313から、動き補償構成要素321によって用いるための参照ブロックへの再構成のために、逆変換および量子化構成要素329に転送される。逆変換および量子化構成要素329は、スケーリングおよび逆変換構成要素229と実質的に同様であってよい。インループフィルタ構成要素325におけるインループフィルタもまた、例に依存して、残差ブロックおよび/または再構築された参照ブロックに適用される。インループフィルタ構成要素325は、フィルタ制御分析構成要素227およびインループフィルタ構成要素225と実質的に同様であってよい。インループフィルタ構成要素325は、インループフィルタ構成要素225に関して論じられるように、複数のフィルタを含んでよい。フィルタリングされたブロックは次に、動き補償構成要素321によって参照ブロックとして用いるために、復号されたピクチャバッファ構成要素323に格納される。復号されたピクチャバッファ構成要素323は、復号されたピクチャバッファ構成要素223と実質的に同様であってよい。
【0089】
図4は、例示的なビデオデコーダ400を示すブロック図である。ビデオデコーダ400は、コーデックシステム200のデコード機能を実装し、および/または、方法100の動作の段階111、113、115および/または117を実装するように利用されてよい。デコーダ400は、例えばエンコーダ300からビットストリームを受信し、エンドユーザへの表示のために、ビットストリームに基づいて再構成された出力ビデオ信号を生成する。
【0090】
ビットストリームは、エントロピー復号構成要素433によって受信される。エントロピー復号構成要素433は、CAVLC、CABAC、SBAC、PIPE符号化、または他のエントロピー復号技術などの、エントロピー復号スキームを実装するように構成される。例えば、エントロピー復号構成要素433は、符号化された更なるデータを、ビットストリームにおける符号語として解釈するためのコンテキストを提供するように、ヘッダ情報を利用し得る。復号された情報は、全体制御データ、フィルタ制御データ、分割情報、動きデータ、予測データ、および残差ブロックからの量子化変換係数などの、ビデオ信号を復号する任意の望ましい情報を含む。量子化変換係数は、残差ブロックに再構成されるように、逆変換および量子化構成要素429に転送される。逆変換および量子化構成要素429は、逆変換および量子化構成要素329と同様であってよい。
【0091】
再構成済み残差ブロックおよび/または予測ブロックは、イントラ予測動作に基づくイメージブロックへの再構成のために、イントラピクチャ予測構成要素417に転送される。イントラピクチャ予測構成要素417は、イントラピクチャ推定構成要素215およびイントラピクチャ予測構成要素217と同様であってよい。具体的には、イントラピクチャ予測構成要素417は、フレームにおける参照ブロックを位置決めするように予測モードを利用し、イントラ予測されたイメージブロックを再構成するように、結果を残差ブロックに適用する。再構成されたイントラ予測されたイメージブロックおよび/または残差ブロック、および対応するインター予測データは、復号されたピクチャバッファ構成要素423に、インループフィルタ構成要素425を介して転送され、それらは実質的に、復号されたピクチャバッファ構成要素223およびインループフィルタ構成要素225と、それぞれ同様である。インループフィルタ構成要素425は、再構成されたイメージブロック、残差ブロック、および/または予測ブロックをフィルタリングし、そのような情報は、復号されたピクチャバッファ構成要素423に格納される。復号されたピクチャバッファ構成要素423から再構成されたイメージブロックは、インター予測のために、動き補償構成要素421に転送される。動き補償構成要素421は、動き推定構成要素221および/または動き補償構成要素219と実質的に同様であってよい。具体的には、動き補償構成要素421は、予測ブロックを生成するように、参照ブロックから動きベクトルを利用し、イメージブロックを再構成するように、結果に残差ブロックを適用する。得られた再構成されたブロックはまた、インループフィルタ構成要素425を介して、復号されたピクチャバッファ構成要素423に転送される。復号されたピクチャバッファ構成要素423は、追加の再構成されたイメージブロックを格納し続け、それは分割情報によってフレームに再構成され得る。そのようなフレームはまた、シーケンスに配置されてよい。シーケンスは、再構成された出力ビデオ信号として、ディスプレイに向けて出力される。
【0092】
図5は、PCC機構に従って符号化され得る点群媒体500の一例である。それに応じて、点群媒体500は、方法100を実行するとき、コーデックシステム200および/またはエンコーダ300などのエンコーダによって符号化されてよく、コーデックシステム200および/またはデコーダ400などのデコーダによって再構成されてよい。
【0093】
図1から
図4に説明された機構は、概して2Dフレームが符号化されているとみなしている。しかしながら、点群媒体500は、経時的に変化する点の群である。具体的には、点群媒体500はまた、点群および/または点群表現と呼ばれてもよいが、3D空間における点のグループである。点は、また、サンプルと呼ばれてよい。各点は、複数の種類のデータに関連付けられ得る。例えば、各点は、ポジションの観点から説明され得る。ポジションは、デカルト座標のセットとして説明され得る3D空間における位置である。さらに、各点は色を含み得る。色は、ルミナンス(例えば、光)およびクロミナンス(例えば、色)の観点で説明され得る。色は、それぞれ(R,G,B)または(Y,U,V)として示される、赤(R)、緑(G)、および青(B)の値、または輝度(Y)、青色差(U)および赤色差(V)の観点で説明され得る。点はまた、他の属性を含み得る。属性は、点群における各点に関連付けられ得る、オプションのスカラーまたはベクトル特性である。属性は、反射率、透過率、表面法線、タイムスタンプ、有形の身分証明書(ID)、などを含み得る。
【0094】
点群媒体500の各点が複数の種類のデータに関連付けられ得るので、
図1から
図4に説明された機構に従って圧縮のために点群媒体500を準備するように、いくつかのサポート機構が利用される。例えば、点群媒体500はフレームにソートされることができ、各フレームは、特定の状態または時間の瞬間における、点群に関する全てのデータを含む。したがって、
図5は、点群媒体500のシングルフレームを描画する。点群媒体500は次に、フレームごとに符号化される。点群媒体500は、3D境界ボックス501によって取り囲まれ得る。3D境界ボックス501は、対応するフレームに関する点群媒体500の点の全てを取り囲むようにサイズ決めされた3D長方形角柱である。点群媒体500が互いに素な集合(disjoint set)を含む場合には、複数の3D境界ボックス501が、利用され得ることに留意されるべきである。例えば、3D境界ボックス501が各図の周りに配置される場合には、点群媒体500は、接続されていない2つの図を描画できるかもしれない。3D境界ボックス501における点は、以下に説明されるように処理される。
【0095】
図6は、点群600から作成されたパッチ603の一例である。点群600は、点群媒体500のシングルフレームである。さらに、点群600は、3D境界ボックス501と実質的に同様である3D境界ボックス601によって取り囲まれる。それに応じて、方法100を実行するとき、点群600は、コーデックシステム200および/またはエンコーダ300などのエンコーダによって符号化されてよく、コーデックシステム200および/またはデコーダ400などのデコーダによって再構成されてよい。
【0096】
3D境界ボックス601は6つの面を含み、したがって、3D境界ボックス601の面にそれぞれ位置する6つの2D長方形フレーム602(例えば、頂部、底部、左、右、前、および後)を含む。点群600は、点群600を、対応する2D長方形フレーム602上に投影することによって、3Dデータから2Dデータに変換され得る。これは、パッチ603の生成をもたらす。パッチ603は3D点群の2D表現であり、パッチ603は対応する2D長方形フレーム602から可視である点群600の表現を含む。2D長方形フレーム602からの点群600の表現は、複数の互いに素な構成要素を含み得ることに留意すべきである。したがって、2D長方形フレーム602は、複数のパッチ603を含み得る。したがって、点群600は、6より多いパッチ603によって表され得る。パッチ603はまた、アトラス、アトラスデータ、アトラス情報、および/またはアトラス成分と呼ばれることがある。3Dデータを2Dフォーマットに変換することによって、点群600は、インター予測および/またはイントラ予測などのビデオ符号化機構に従って符号化され得る。
【0097】
図7Aから
図7Cは、
図6に説明されたように2D情報に変換された3D点群を符号化する機構を示す。具体的には、
図7Aは、パッチ603などのパッチのセットに関連付けられた、例示的な占有フレーム710を示す。占有フレーム710はバイナリ形式で符号化される。例えば、0は、境界ボックス601の部分が、パッチ603の1つによって占有されないことを表す。0によって表された境界ボックス600のそれらの部分は、ボリュメトリック表現(例えば、点群600)の再構成に関与しない。対照的に、1は、境界ボックス600の部分が、パッチ603の1つによって占有されることを表す。1によって表された境界ボックス600のそれらの部分は、ボリュメトリック表現(例えば、点群600)の再構成に関与する。さらに、
図7Bは、パッチ603などの、パッチのセットに関連付けられた例示的な幾何フレーム720を示す。ジオメトリフレーム720は、パッチ603の各々の輪郭またはトポグラフィを提供または描画する。具体的には、ジオメトリフレーム720は、パッチ603における各点が境界ボックス600の平面(例えば、2D長方形フレーム602)から離れる距離を示す。また、
図7Cは、パッチ603などの、パッチのセットに関連付けられた例示的なアトラスフレーム730を示す。アトラスフレーム730は、境界ボックス600におけるパッチ603のサンプルを提供または描画する。アトラスフレーム730は、例えば、パッチ603における点の色成分を含み得る。色成分は、RGB色モデル、YUV色モデルに基づいてよく、または別の知られている色モデルに基づいてよい。占有フレーム710、ジオメトリフレーム720、およびアトラスフレーム730は、点群600および/または点群媒体500を符号化するように利用され得る。したがって、方法100を実行するとき、占有フレーム710、ジオメトリフレーム720、およびアトラスフレーム730は、コーデックシステム200および/またはエンコーダ300などのエンコーダによって符号化されてよく、コーデックシステム200および/またはデコーダ400などのデコーダによって再構成されてよい。
【0098】
3D情報を2D平面上に投影することによって作成される様々なパッチが、長方形(または正方形)映像フレームに圧縮され得る。AVC、HEVCおよびVVCなどの様々なビデオコーデックが、そのようなビデオフレームを符号化するように予め構成されているので、この手法は有利である。したがって、PCCコーデックは、パッチを符号化するように、他のビデオコーデックを利用し得る。
図7Aに示されるように、パッチはフレームに圧縮され得る。パッチは任意のアルゴリズムによって圧縮され得る。例えば、パッチは、サイズに基づいてフレームに圧縮され得る。特定の例において、パッチは最大から最小までを含む。最大のパッチは、任意の開放空間に最初に配置され得、より小さいパッチは、ひとたびサイズ閾値が交差した間隙を満たすように配置され得る。
図7Aに示されるように、そのような圧縮方式は、パッチデータを含まない空白をもたらす。空白の符号化を回避するように、占有フレーム710が利用される。占有フレーム710は、特定の瞬間の時間における点群の全ての占有データを含む。具体的には、占有フレーム710は、1または複数の占有マップ(占有データ、占有情報、および/または占有成分としてもまた知られる)を含む。占有マップは、その値がアトラスの各サンプル位置に関して、そのポジションが点群表現における有効な3D点に対応するかどうかを示す、アトラス(パッチのグループ)に対応する2Dアレイとして定められる。
図7Aに示されるように、占有マップは有効なデータ713のエリアを含む。有効なデータ713のエリアは、アトラス/パッチデータが占有フレーム710に対応する位置において存在することを示す。占有マップはまた、無効なデータ715のエリアを含む。無効なデータ715のエリアは、占有フレーム710における対応する位置にアトラス/パッチデータが存在しないことを示す。
【0099】
図7Bは、点群データのジオメトリフレーム720を描画する。特定の瞬間の時間における点群に関して、ジオメトリフレーム720は1または複数のジオメトリマップ723(ジオメトリデータ、ジオメトリ情報、および/またはジオメトリ成分としてもまた知られる)を含む。ジオメトリマップ723は、各パッチに関連付けられたジオメトリ情報のアグリゲーションを介して作成される2Dアレイであり、ジオメトリ情報/データは、点群フレームに関連付けられたデカルト座標のセットである。具体的には、パッチは全て3D空間における点から投影される。そのような投影は、パッチから3D情報を除去する効果を有する。ジオメトリマップ723は、パッチから除去された3D情報を保持する。例えば、パッチにおける各サンプルが、3D空間における点から取得される。それに応じて、ジオメトリマップ723は、各パッチにおける各サンプルに関連付けられた3D座標を含み得る。したがって、ジオメトリマップ723は、3D点群を再構成するために2Dパッチを3D空間に戻すようにマッピング/変換するように、デコーダによって用いられ得る。具体的には、点群を再構成するように、デコーダは各パッチサンプルを適切な3D座標上にマッピングし得る。
【0100】
図7Cは、点群データのアトラスフレーム730を描画する。特定の瞬間の時間における点群に関して、アトラスフレーム730は、1または複数のアトラス733(アトラスデータ、アトラス情報、アトラス成分、および/またはパッチとしてもまた知られる)を含む。アトラス733は、3D空間における3D境界ボックスに対応する長方形枠に投影された2D境界ボックスの集合体であり、各2D境界ボックス/パッチは、点群のサブセットを表す。具体的には、アトラス733は、
図6に関して説明されたように、3D点群が2D空間に投影されたとき作成されたパッチを含む。したがって、アトラス733/パッチは、点群に関連付けられたイメージデータ(例えば、色および光の値)、および対応する瞬間の時間を含む。アトラス733は、
図7Aの占有マップおよび
図7Bのジオメトリマップ723に対応する。具体的には、アトラス733は有効なデータ713のエリアにおけるデータを含み、無効なデータ715のエリアにおけるデータを含まない。さらに、ジオメトリマップ723は、アトラス733におけるサンプルに関する3D情報を含む。
【0101】
点群が属性(属性データ、属性情報、および/または属性成分としてもまた知られる)を含み得ることもまた留意すべきである。そのような属性は、アトラスフレームに含まれ得る。アトラスフレームは、特定の瞬間の時間における点群の対応する属性に関する全てのデータを含み得る。属性は幅広い異なるデータを含み得るので、属性フレームの一例は図示しない。具体的には、反射率、表面法線、タイムスタンプ、素材IDなど、属性は点群における各点に関連付けられた任意のスカラまたはベクトル特性であり得る。さらに、属性は任意選択(例えば、ユーザ定義)であり、用途に基づいて変わり得る。しかしながら、用いられるとき、点群属性は、アトラス733、ジオメトリマップ723、および占有マップと同様の方式で、属性フレームに含まれてよい。
【0102】
それに応じて、エンコーダは点群フレームを、アトラス733のアトラスフレーム730、ジオメトリマップ723のジオメトリフレーム720、占有マップの占有フレーム710、および任意選択で属性の属性フレームに圧縮し得る。アトラスフレーム730、ジオメトリフレーム720、占有フレーム710、および/または属性フレームはさらに、デコーダへの伝送のために、例えば異なるエンコーダによって圧縮され得る。デコーダは、アトラスフレーム730、ジオメトリフレーム720、占有フレーム710、および/または属性フレームを解凍し得る。デコーダは次に、対応する瞬間の時間において再構成された点群を決定するために点群フレームを再構成するように、アトラスフレーム730、ジオメトリフレーム720、占有フレーム710、および/または属性フレームを利用する。再構成された点群フレームは次に、オリジナル点群シーケンスを再構成するように(例えば、表示のために、および/または、データ分析における使用のために)、シーケンスで含まれてよい。特定の例として、アトラスフレーム730および/またはアトラス733は、
図1から
図4に関して説明された技法を利用して、例えば、VVC、HEVC、および/またはAVCコーデックを利用して、符号化および復号され得る。
【0103】
図8は、例示的な適合性テスト機構800の概略図である。適合性テスト機構800は、PCCビットストリームが規格に適合すること、したがって、コーデックシステム200および/またはデコーダ400などのデコーダによって復号可能であることを検証するように、コーデックシステム200および/またはエンコーダ300などのエンコーダによって利用されてよい。例えば、適合性テスト機構800は、方法100を実行するとき正しく復号される方式で、点群媒体500および/またはパッチ603が、占有フレーム710、ジオメトリフレーム720、アトラスフレーム730、および/または属性フレームに符号化されたかどうかをチェックするように利用されてよい。
【0104】
適合性テスト機構800は、規格との適合性に関してPCCビットストリームをテストし得る。規格に適合するPCCビットストリームは、また規格に適合する任意のデコーダによって常に復号可能であるべきである。規格に適合しないPCCビットストリームは、復号可能でなくてもよい。したがって、適合性テスト機構800に失敗するPCCビットストリームは、例えば異なる設定を使用して、再符号化されるべきである。適合性テスト機構800は、タイプI適合性テスト881およびタイプII適合性テスト883を含み、それらはまた、それぞれ適合点AおよびBと呼ばれ得る。タイプI適合性テスト881は、適合性に関して、PCCビットストリームの成分をチェックする。タイプII適合性テスト883は、適合性に関して、再構成された点群をチェックする。エンコーダは概して、タイプI適合性テスト881を実行するために必要であり、任意選択で、タイプII適合性テスト883を実行し得る。
【0105】
適合性テスト機構800の実行の前に、エンコーダは、上記で説明されたように、圧縮されたV-PCCビットストリーム801を符号化する。エンコーダは次に、圧縮されたV-PCCビットストリーム801上で、適合性テスト機構800を実行するようにHRDを利用する。適合性テスト機構800は、圧縮されたV-PCCビットストリーム801を成分に分離する。具体的には、圧縮されたV-PCCビットストリーム801は圧縮されたアトラスサブビットストリーム830、圧縮された占有マップサブビットストリーム810、圧縮されたジオメトリサブビットストリーム820、および任意選択で圧縮された属性サブビットストリーム840に分割され、それらは、符号化されたアトラスフレーム730、符号化されたジオメトリフレーム720、占有フレーム710、および任意選択で属性フレームのシーケンスをそれぞれ含む。
【0106】
ビデオ解凍860は、サブストリーム上で実行される。ビデオ解凍860は、構成要素特有の圧縮の逆の機構である。圧縮されたアトラスサブビットストリーム830、圧縮された占有マップサブビットストリーム810、圧縮されたジオメトリサブビットストリーム820、および圧縮された属性サブビットストリーム840は、1または複数のコーデックによって符号化され得、したがって、ビデオ解凍860は、対応するサブビットストリームを作成するように利用されるエンコーダに基づいて各サブビットストリームに仮想デコーダを適用することを含む。ビデオ解凍860は、解凍されたアトラスサブビットストリーム831、解凍された占有マップサブビットストリーム811、解凍されたジオメトリサブビットストリーム821、および解凍された属性サブビットストリーム841を、圧縮されたアトラスサブビットストリーム830、圧縮された占有マップサブビットストリーム810、圧縮されたジオメトリサブビットストリーム820、および圧縮された属性サブビットストリーム840から、それぞれ再構成する。解凍されたサブビットストリーム/構成要素は、復号処理の一部として、または、この場合、HRD適合性テストの一部として、再構成され得るサブビットストリームからのデータである。
【0107】
タイプI適合性テスト881は、解凍されたアトラスサブビットストリーム831、解凍された占有マップサブビットストリーム811、解凍されたジオメトリサブビットストリーム821、および解凍された属性サブビットストリーム841に適用される。タイプI適合性テスト881は、対応する成分が、成分を符号化および復号するコーデックによって用いられる規格に適合することを確実にするように、各成分(解凍されたアトラスサブビットストリーム831、解凍された占有マップサブビットストリーム811、解凍されたジオメトリサブビットストリーム821、および解凍された属性サブビットストリーム841)をチェックする。例えば、タイプI適合性テスト881は、標準化された量のハードウェアリソースが、バッファオーバーランまたはアンダーランなしで、対応する成分を解凍できることを検証し得る。さらに、タイプI適合性テスト881は、HRDが対応する成分を正しく再構成することを阻止する符号化エラーに関して、成分をチェックし得る。さらに、タイプI適合性テスト881は、全ての基準要求が満たされて全ての基準禁止事項が省略されることを確実にするように、各対応する成分をチェックし得る。タイプI適合性テスト881は、全ての成分が対応するテストをパスしたときに満たされ、成分の任意の1つが対応するテストに失敗したときに満たされていない。タイプI適合性テスト881をパスする任意の成分は、対応する基準にまた適合する任意のデコーダにおいて復号可能であるべきである。したがって、タイプI適合性テスト881は、圧縮されたV-PCCビットストリーム801を符号化するときに利用されてよい。
【0108】
タイプI適合性テスト881は、成分が復号可能であることを確実にするが、タイプI適合性テスト881は、デコーダが対応する構成要素からオリジナル点群を再構成し得ることを保証しない。それに応じて、適合性テスト機構800はまた、タイプII適合性テスト883を実行するように利用され得る。解凍された占有マップサブビットストリーム811、解凍されたジオメトリサブビットストリーム821、および解凍された属性サブビットストリーム841が、変換861のために転送される。具体的には、変換861は、解凍された占有マップサブビットストリーム811、解凍されたジオメトリサブビットストリーム821、および解凍された属性サブビットストリーム841の、彩度フォーマット、解像度、および/またはフレームレートを、解凍されたアトラスサブビットストリーム831の彩度フォーマット、解像度、および/またはフレームレートに適合する要望どおりに変換する。
【0109】
変換861の結果、ならびに解凍されたアトラスサブビットストリーム831は、ジオメトリ再構成862に転送される。ジオメトリ再構成862において、解凍された占有マップサブビットストリーム811の占有マップは、有効なアトラスデータの位置を決定するように利用される。ジオメトリ再構成862は次に、有効なアトラスデータを含む任意の位置からの解凍されたジオメトリサブビットストリーム821から、ジオメトリデータを取得し得る。ジオメトリデータは次に、点の粗い群を再構成するように利用され、それは重複点除去863に転送される。例えば、3Dクラウドから2Dパッチの生成の最中、いくつかのクラウド点は複数の方向から見られ得る。これが起こるとき、同じ点が、1つより多いパッチに、サンプルとして投影される。ジオメトリデータは次に、サンプルに基づいて生成され、したがって、そのような点に関する重複データを含む。ジオメトリデータが、複数の点が同一位置に位置することを示すとき、重複点除去863は、単一の点を作成するように、そのような重複データをマージする。結果は、オリジナルで符号化された点群のジオメトリをミラーリングする再構成されたジオメトリ871である。具体的には、再構成されたジオメトリ871は、符号化済み点群の各点の3D位置を含む。
【0110】
再構成されたジオメトリ871は、スムージング864のために転送される。具体的には、再構成されたジオメトリ871は、符号化処理の最中に作成されたノイズに起因して鋭く見える一定の特徴を含み得る。スムージング864は、オリジナルで符号化された点群の正確な表現であるスムージングされたジオメトリ873を作成べく、そのようなノイズを除去するように1つまたは複数のフィルタを利用する。スムージングされたジオメトリ873は次に、解凍されたアトラスサブビットストリーム831からのアトラスデータおよび変換861からの属性データと共に、属性再構成865に転送される。属性再構成865は、アトラス/パッチデータからの色によって、スムージングされたジオメトリ873に位置する点を色づける。属性再構成865はまた、点の任意の属性を適用する。これは、オリジナルで符号化された点群をミラーリングする再構成された群875をもたらす。再構成された群875は、符号化処理によって生じる色または他の属性ノイズを含み得る。それに応じて、再構成された群875はカラースムージング866に関して転送され、それは、そのようなノイズをスムージングするように、1つまたは複数のフィルタを、輝度、彩度、または他の属性値に適用する。カラースムージング866は次に、再構成された点群877を出力する。再構成された点群877は、ロスレス符号化が利用される場合、オリジナルで符号化された点群の正確な表現であるべきである。そうでない場合は、再構成された点群877は、予め定義された許容範囲を越えない相違で、オリジナルで符号化された点群に近く近似する。
【0111】
タイプII適合性テスト883が、再構成された点群877に適用される。タイプII適合性テスト883は、再構成された点群877がV-PCC基準に適合し、したがって、V-PCC基準に適合するデコーダによって復号され得ることを確実するように、再構成された点群877をチェックする。例えば、タイプII適合性テスト883は、標準化された量のハードウェアリソースが、バッファオーバーランまたはアンダーランなしで、再構成された点群877を再構成できることを検証し得る。さらに、タイプII適合性テスト883は、HRDが再構成された点群877を正しく再構成することを阻止する符号化エラーに関して、再構成された点群877をチェックし得る。さらに、タイプII適合性テスト883は、全ての基準要求が満たされて全ての基準禁止事項が省略されることを確実にするように、各解凍された成分および/または任意の中間データをチェックし得る。タイプII適合性テスト883は、再構成された点群877および任意の中間構成要素が対応するテストをパスしたときに満たされ、再構成された点群877および任意の中間構成要素が対応するテストに失敗したときに満たされていない。再構成された点群877がタイプII適合性テスト883をパスするとき、再構成された点群877は、またV-PCC基準に適合する任意のデコーダで復号可能であるべきである。したがって、タイプII適合性テスト883は、圧縮されたV-PCCビットストリーム801の、タイプI適合性テスト881よりロバストな検証を提供し得る。
【0112】
図9は、例えばPCCビットストリーム上で適合性テスト機構800を利用することによって、適合性テストを実行するように構成される例示的なHRD900の概略図であり、それは占有フレーム710、ジオメトリフレーム720、アトラスフレーム730、および/または属性フレームに符号化された点群媒体500および/またはパッチ603を含み得る。したがって、HRD900は、コーデックシステム200および/またはデコーダ400による復号のために方法100の一部としてビットストリームを符号化する、コーデックシステム200および/またはエンコーダ300によって利用されてよい。具体的には、HRD900は、PCCビットストリームがデコーダに転送される前に、PCCビットストリームおよび/またはその成分をチェックし得る。いくつかの例において、PCCビットストリームは、PCCビットストリームが符号化されるときにHRD900を介して継続的に転送され得る。PCCビットストリームの部分が、関連付けられた制約に適合することに失敗した場合には、HRD900はエンコーダにそのような失敗を示し得、それは、エンコーダに、ビットストリームの対応するセクションを異なる機構で再符号化させ得る。いくつかの例においてHRD900は、アトラスサブビットストリーム上、および/または再構成された点群上で、チェックを実行するように構成され得る。いくつかの例において、占有マップ成分、ジオメトリ成分、および属性成分が、他のコーデックによって符号化され得る。したがって、占有マップ成分、ジオメトリ成分、および属性成分を含むサブビットストリームは、他のHRDによってチェックされ得る。したがって、HRD900を含む複数のHRDが、いくつかの例における適合性に関して、PCCビットストリームを完全にチェックするように利用され得る。
【0113】
HRD900は、仮想ストリームスケジューラ(HSS)941を含む。HSS941は、仮想デリバリ機構を実行するように構成される構成要素である。仮想デリバリ機構は、HRD900に入力されるPCCビットストリーム951のタイミングおよびデータフローに関して、ビットストリーム、サブビットストリーム、および/またはデコーダの適合性をチェックするように用いられる。例えば、HSS941は、エンコーダから出力される、PCCビットストリーム951またはそのサブビットストリームを受信し得る。HSS941は次に、例えば適合性テスト機構800を利用することによって、PCCビットストリーム951上で適合性テスト処理を管理する。特定の例において、HSS941は、符号化されたアトラスデータがHRD900を通って移動する速さを制御し、PCCビットストリーム951が不適合データを含まないことを検証する。HSS941は、予め定められた速さでPCCビットストリーム951をCAB943に転送し得る。HRD900の目的に関して、AUおよび/またはNALユニットなどの、ビットストリーム951における符号化されたビデオを含む任意のユニットが、復号中のアトラスユニット953と呼ばれ得る。復号中のアトラスユニット953は、いくつかの例において、アトラスデータのみを含み得る。他の実施例において、復号中のアトラスユニット953は、他のPCC構成要素および/または点群を再構成するデータのセットを含み得る。それに応じて、復号中のアトラスユニット953は、概して、同じ例において復号ユニットと呼ばれ得る。CAB943は、HRD900における先入れ先出しバッファである。CAB943は、復号順に、アトラスデータ、ジオメトリデータ、占有データ、および/または属性データを含む復号中のアトラスユニット953を含む。CAB943は、PCCビットストリーム適合性テスト/チェックの最中の使用のために、そのようなデータを格納する。
【0114】
CAB943は、復号中のアトラスユニット953を復号処理コンポーネント945に転送する。復号処理コンポーネント945は、PCCビットストリームおよび/またはそのサブビットストリームを符号化するように利用されるPCC基準または他の基準に適合する構成要素である。例えば、復号処理コンポーネント945は、エンドユーザによって利用されるデコーダをエミュレートし得る。例えば、復号処理コンポーネント945は、アトラス成分を復号することによってタイプI適合性テストを、および/または、点群データを再構成することによってタイプII適合性テストを、実行し得る。復号処理コンポーネント945は、例示的な標準化されたデコーダによって実現され得る速さで、復号中のアトラスユニット953を復号する。復号処理コンポーネント945が、復号中のアトラスユニット953を、CAB943のオーバフローを防止するのに十分迅速に復号しない場合、次に、PCCビットストリーム951はその規格に適合せず、再符号化されるべきである。同様に、復号処理コンポーネント945が復号中のアトラスユニット953をあまりに素早く復号する場合、CAB943はアウトオブデータ(例えば、バッファアンダーラン)となり、次に、PCCビットストリーム951はその規格に適合せず、再符号化されるべきである。
【0115】
復号処理コンポーネント945は、復号中のアトラスユニット953を復号し、それは、復号されたアトラスフレーム955を作成する。復号されたアトラスフレーム955は、タイプI適合性テストの場合にはPCCフレームに関するアトラスデータの完全なセットを含み得、タイプII適合性テスト文脈においては再構成された点群のフレームを含み得る。復号されたアトラスフレーム955は、DAB947に転送される。DAB947は、PCCビットストリーム適合性テストの最中に用いるように復号順に、復号された/解凍されたアトラスフレームおよび/または再構成された点群フレーム(コンテキストに依存して)を含む、HRD900における先入れ先出しバッファである。DAB947は、復号されたピクチャバッファ構成要素223、323および/または423と実質的に同様であってよい。インター予測をサポートするように、復号されたアトラスフレーム955から取得された参照アトラスフレーム956として用いるように示されたフレームが、さらなる復号をサポートするように復号処理コンポーネント945に返される。DAB947は、フレームごとに、アトラスデータ957(または、コンテキストに依存して、再構成された点群)を出力する。したがって、HRD900は、符号化が満足されるかどうかを決定し得、制約が、PCCビットストリーム951および/またはその成分によって満たされるかどうかを決定し得る。
【0116】
図10は、適合性テスト機構800などのHRD適合性テストをサポートするように、HRD900などのHRDを初期化する使用のための、例示的PCCビットストリーム1000を示す概略図である。例えば、ビットストリーム1000は、方法100に従ってコーデックシステム200および/またはデコーダ400によって復号するように、コーデックシステム200および/またはエンコーダ300によって生成され得る。さらに、ビットストリーム1000は、占有フレーム710、ジオメトリフレーム720、アトラスフレーム730、および/または属性フレームに符号化される、点群媒体500および/またはパッチ603を含み得る。
【0117】
PCCビットストリーム1000は、PCC AU1010のシーケンスを含む。PCC AU1010は、特定の時間の瞬間においてキャプチャされる単一のPCCフレームを再構成するのに十分な構成要素を含む。例えば、PCC AU1010は、アトラスフレーム1011、占有マップフレーム1013、およびジオメトリマップフレーム1015を含み得、それらは実質的に、アトラスフレーム730、占有フレーム710、およびジオメトリフレーム720とそれぞれ同様である。PCC AU1010はまた属性フレーム1017を含み、それはPCC AU1010において符号化されたときの時間の瞬間における点群に関する全ての属性を含む。そのような属性は、色、反射率、表面法線、タイムスタンプ、素材IDなどの、点群における各点に任意選択で関連付けられたスカラまたはベクトル特性を含み得る。PCC AU1010は、特定の分類規則に従って互いに関連付けられたNALユニットのセットを定め、ある特定の出力時間に関連する。したがって、データはNALユニットにおいてPCC AU1010にポジション決めされる。NALユニットは、パケットサイズのデータコンテナである。例えば、単一のNALユニットは、概して、ネットワーク伝送が可能なサイズとされる。NALユニットは、NALユニットタイプを示すヘッダと、関連データを含むペイロードとを含む。
【0118】
PCCビットストリーム1000はまた、例えば復号処理の一部および/またはHRD処理の一部として、PCC AU1010の復号をサポートする様々なデータ構造を含む。例えば、PCCビットストリーム1000は、1または複数のPCC AU1010を符号化するように用いられるパラメータを含む様々なパラメータセットを含んでよい。具体例として、PCCビットストリーム1000は、アトラスシーケンスパラメータセット(SPS)1020を含んでよい。アトラスSPS1020は、各タイルグループヘッダにおいて発見されるシンタックス要素と呼ばれるアトラスSPS1020において発見されるシンタックス要素のコンテンツによって決定されるように、0またはより多くの完全に符号化されたアトラスシーケンスに適用するシンタックス要素を含むシンタックス構造である。例えば、アトラスSPS1020は、アトラスフレーム1011の全配列に関するパラメータを含み得る。
【0119】
PCCビットストリーム1000はまた、様々なSEIメッセージを含む。SEIメッセージは、復号されたピクチャにおいてサンプルの値を決定すべく復号処理によって不要である情報を伝える特定の意味論を有する、シンタックス構造である。それに応じて、SEIメッセージは、PCC AU1010の復号に直接関しないデータを伝えるように利用され得る。示された例において、PCCビットストリーム1000は、バッファリング期間SEIメッセージ1030およびアトラスフレームタイミングSEIメッセージ1040を含む。
【0120】
上記に留意されるように、いくつかのPCC関連するビデオ符号化システムは、HRD900および/または適合性テスト機構800を利用するように構成されなくともよい。示される例において、アトラスSPS1020、バッファリング期間SEIメッセージ1030、およびアトラスフレームタイミングSEIメッセージ1040は、PCCビットストリーム1000上で適合性テストを実行するときにHRDの機能を初期化および管理するように利用される。例えば、HRDパラメータ1021は、アトラスSPS1020に含まれ得る。HRDパラメータ1021は、HRDの作動条件を初期化する、および/または定める、シンタックス要素である。例えば、HRDパラメータ1021は、HRDにおけるHRD適合性チェックのために、タイプI適合性テスト881またはタイプII適合性テスト883などの適合点を指定するように利用され得る。したがって、HRDパラメータ1021は、HRD適合性チェックが解凍されたPCC成分または再構成された点群上で実行されるべきかどうかを示すように利用され得る。例えば、HRDパラメータ1021は、HRD適合性チェックが、解凍された属性成分、解凍されたアトラス成分、解凍された占有マップ成分、および解凍されたジオメトリ成分(例えば、それぞれ属性フレーム1017、アトラスフレーム1011、占有マップフレーム1013、およびジオメトリマップフレーム1015)上で実行されるべきであることを示すように、第1の値に設定され得る。さらに、HRDパラメータ1021は、HRD適合性チェックが、PCC成分から再構成された点群(例えば、PCC AU1010全体から再構成された)上で実行されるべきであることを示すように、第1の値に設定され得る。
【0121】
バッファリング期間SEIメッセージ1030は、HRDにおけるCAB(例えば、CAB943)に関する初期除去遅延を示すデータを含むSEIメッセージである。初期CAB除去遅延は、ビットストリームにおけるPCC AU1010などの第1AUにおける時間量成分であり、または、アトラスフレーム1011などのサブビットストリームにおける第1AUは、除去の前にCABに残り得る。例えば、HRDは、バッファリング期間SEIメッセージ1030によって指定された初期遅延に基づいて、HRD適合性チェックの最中にHRDにおけるCABから第1のPCC AU1010に関する任意の復号ユニットの除去を始めることができる。したがって、バッファリング期間SEIメッセージ1030は、バッファリング期間SEIメッセージ1030に関連付けられた符号化されたPCC AU1010で始まるようにHRD適合性テスト処理を初期化するために十分なデータを含む。具体的には、バッファリング期間SEIメッセージ1030は、適合性テストがPCCビットストリーム1000における第1のPCC AU1010で始まるべきであることを、HRDに示し得る。
【0122】
アトラスフレームタイミングSEIメッセージ1040は、CAB(例えば、CAB943)に関する除去遅延と、HRDにおけるDAB(例えば、DAB947)に関する出力遅延とを示すデータを含むSEIメッセージである。CAB除去遅延は、除去の前に成分(例えば、対応する成分)がCABに残り得る、時間の量である。CAB除去遅延は、バッファリング期間SEIメッセージ1030によって示される初期CAB除去遅延を参照して符号化され得る。DAB出力遅延は、(例えば、再構成された点群の一部として)出力となる前に解凍された/復号された成分がDABに残り得る(例えば、任意の対応する成分)、時間の量であり得る。したがって、HRDは、アトラスフレームタイミングSEIメッセージ1040によって指定された適合性チェックの最中に、HRDにおけるCABから復号ユニットを除去し得る。さらに、HRDは、アトラスフレームタイミングSEIメッセージ1040によって指定されるようにHRDにおけるDABの出力遅延を設定し得る。
【0123】
それに応じて、エンコーダは、符号化処理の最中に、HRDパラメータ1021、バッファリング期間SEIメッセージ1030、およびアトラスフレームタイミングSEIメッセージ1040をPCCビットストリーム1000に符号化し得る。HRDは次に、PCCビットストリーム1000上で、適合性テスト機構800などの適合性チェックを実行するのに十分な情報を取得するように、HRDパラメータ1021、バッファリング期間SEIメッセージ1030、およびアトラスフレームタイミングSEIメッセージ1040を読み出し得る。さらに、デコーダはHRDパラメータ1021、バッファリング期間SEIメッセージ1030、および/またはアトラスフレームタイミングSEIメッセージ1040をPCCビットストリーム1000から取得し、そのようなデータの存在によって、HRDチェックがPCCビットストリーム1000上で実行されたことを推測する。したがって、デコーダは、PCCビットストリーム1000が復号可能であることを推測し、したがって、HRDパラメータ1021、バッファリング期間SEIメッセージ1030、および/またはアトラスフレームタイミングSEIメッセージ1040に基づいて、PCCビットストリーム1000を復号し得る。
【0124】
PCCビットストリーム1000は、様々なサイズであり得、様々なレートで伝送ネットワークを介してエンコーダからデコーダへ伝送され得る。例えば、HEVCベースのエンコーダが利用されるとき、おおよそ1時間の長さである容量シーケンスは、15~70ギガバイトのファイルの大きさのPCCビットストリーム1000に符号化され得る。VVCベースのエンコーダは、HEVCエンコーダに対して、さらにファイルの大きさを約30~35パーセント低減し得る。それに応じて、VVCエンコーダで符号化される1時間の長さの容量シーケンスは、約10~49ギガバイトのサイズのファイルをもたらし得る。PCCビットストリーム800は、伝送ネットワークのステータスに依存して、異なる複数のレートで伝送され得る。例えば、PCCビットストリーム1000は、毎秒5~20メガバイトのビットレートでネットワークを伝送され得る。同様に、本明細書で説明される符号化および復号処理は、例えば、毎秒1メガバイトより高速のレートで実行され得る。
【0125】
ここで、前述の情報は、以下の本明細書において、より詳細に説明される。点群とは、3次元(3D)空間におけるデータ点のセットである。各データ点は、ポジション、色(R、G、B)、または(Y、U、V)、および任意選択で透過率、反射率、取得時間などのような他の特性を決定するパラメータを含む。ポジションは、X軸、Y軸およびZ軸に対する点として説明されてよい。群における各点は、同じ番号の属性によって説明されてよい。点群は、リアルタイムの3D没入型テレプレゼンス、インタラクティブな視差を用いて見るコンテンツ仮想現実(VR)、3Dの自由視点スポーツ再生放送、地理情報システム、文化遺産、大規模な3Dの動的マップに基づく自律走行、および自動車用途などの様々な用途に用いられてよい。ISO/IEC Moving Picture Experts Group(MPEG)は、可逆圧縮および不可逆圧縮をされた点群データに関する、かなり高い符号化効率とネットワーク環境へのロバスト性とを有する点群符号化に関する新たなコーデック規格の開発を管理する。このコーデック規格を用いると、点群は、コンピュータデータの形態として操作され、様々な記憶媒体に格納され、ネットワークを介して送受信され、放送チャネルで配信されることが可能になる。PCC動作は、PCCカテゴリ1、PCCカテゴリ2、およびPCCカテゴリ3に分類されてよい。PCCカテゴリ2のバージョンはまた、V-PCCと呼ばれるが、MPEG出力文書N18479に含まれる。V-PCCは、動的な点群の占有情報、ジオメトリ情報、およびテクスチャ情報(ならびに他のタイプの属性)を圧縮するように、AVC、HEVC、VVCなどの、他のビデオコーデックを活用して設計される。これは、異なるビデオシーケンスのセットとして点群データを圧縮することをもたらす。アトラス/パッチ情報などの、ビデオサブストリームを解釈するための追加のメタデータもまた、別々に生成され、圧縮され得る。
【0126】
いくつかのV-PCC設計はある問題を有し得る。第1の例の問題は、例示的なV-PCCシステムは、符号化されたV-PCCフレームがIRAPフレームか否かを示すシグナリングを採用しないことがあることである。例えば、V-PCCシステムは、各参照パッチフレームリストにおけるアクティブエントリの数をチェックすることによって、パッチ/アトラスフレームがIRAPフレームであるかどうかを決定し得る。参照パッチフレームリストがV-PCCフレームに関して0のアクティブエントリを含む場合、次に、フレームはIRAPフレームである。この決定は、パッチフレームオーダーカウント(PFOC)導出処理の一部として行われ得る。そのような処理は、V-PCCフレームがIRAPフレームであるかどうかの直接的なインジケーションが不足する。IRAPインジケーションの不足は、システム動作に関する困難を生成する。さらに、IRAPインジケーションの不足はまた、復号処理に関する問題を生成する。例示的な実装において、PFOC導出処理がまず呼び出され得る。次に、参照パッチフレームリスト(RPFL)構成処理が実行され、参照パッチフレームマーキング処理が続く。しかしながら、第1パッチフレームの後の任意のパッチフレームは、復号順に、より前にあるパッチフレームの後に復号される。それに応じて、第1パッチフレームの後の任意のパッチフレームは、少なくとも1つの復号されたパッチフレームを含む復号されたピクチャフレームバッファ(DPFB)に関連付けられてよい。参照パッチフレームバッファに利用可能な参照パッチフレームがないとき、PFOC導出処理は、PFOC最上位ビット(MSB)リセットをトリガする。そのような場合には、PFOC MSBリセットをトリガするためのPFOC導出処理は、まさに最初のパッチフレーム以外を決して満たさない。したがって、まさに最初のパッチフレームの後の全てのパッチフレームに関して、PFOC最上位ビット(MSB)は適宜リセットされなくてもよく、正しいIRAP決定を阻止することがある。したがって、まさに最初のパッチフレーム以外の任意のポジションからのランダムアクセス可能性は、いくつかのV-PCCシステムにおいて正しく動作しないことがある。
【0127】
第2の例の問題は、いくつかのV-PCCシステムは、HRDなどのバッファリングモデルを含み得ることである。このようなシステムは、V-PCCビットストリームおよびV-PCCデコーダ適合性をチェックすることができない。適合性チェックの不足は、V-PCCシステムが、異なるエンティティによって製造されたアプリケーション、コンテンツおよびデバイスと正しく連動して動作することを阻止することがある。
【0128】
第3の例の問題は、いくつかのV-PCCシステムが、V-PCC AU内の符号化されたフレーム上での復号順序の制約を適用しないことがあることである。さらに、そのようなV-PCCシステムは、AUの開始の明示的なシグナリング機構を採用しないことがある。したがって、V-PCC AU境界検出は、いくつかのV-PCCシステムにおいて難しいことがある。
【0129】
一般的に、本開示は、V-PCCに関する技法を説明する。より具体的には、本開示は、V-PCCに関する高レベルなシンタックスの改善された設計のための技法を説明する。具体的には、本開示は、前述の問題の1または複数の解決法を提供する。
【0130】
第1の問題を解決すべく、符号化されたV-PCCフレームがIRAPフレームであるかどうかを示すインジケーションが、明示的にシグナリングされてよい。例えば、V-PCCユニットヘッダにおけるビットが、そのようなインジケーションのために用いられてよい。一例において、そのようなインジケーションは、vpcc_irap_flagと呼ばれ得る。以下の変更は、そのような更新をサポートするように行われてよい。符号化された点群シーケンス(CPC)の定義は、以下で説明されるように変更されてよい。さらに、IRAP V-PCC AUの定義が追加されてよい。また、ptgh_typeがIRAPパッチフレームに関して1に等しく設定されるように、制約が追加されてよい。PFOC導出処理は、参照パッチフレームバッファに利用可能な参照パッチフレームがあるかどうかをチェックする代わりに、現在のパッチフレームがIRAPフレームであるかどうかをチェックするように変更され得る。さらに、参照パッチフレームマーキング処理は、現在のパッチフレームがIRAPフレームであるときに、DPFBにおける現時点の全ての/任意の参照パッチフレームを、参照のために未使用であるとマークするように変更されてよい。例示的な実装において、V-PCCユニットヘッダにおける3ビットが(例えば、フラグの代わりに)、フレームがIRAPフレームであることを示すように用いられ得る。この手法は、6つのV-PCC IRAPタイプの明らかな仕様を可能にするかもしれず、それらは、HEVCの6つの異なるタイプのIRAPピクチャにマップされてよい。さらに、パッチタイルグループヘッダシンタックスは、vpcc_irap_flagが1に等しいときにRPFLシンタックス要素が存在しないように、変更されてよい。
【0131】
別の実装形態において、RPFLシンタックス要素は、IRAPフレームに関連付けられた各RPFLに関して、0のアクティブエントリを含むように要求されることがある。さらに、リスト構成処理およびマーキング処理が、PFOC導出処理の呼び出しの前に呼び出されてよい。そのような場合、参照パッチフレームバッファにおける利用可能な参照パッチフレームがないという条件がPFOC導出処理において真であるとき、PFOCはIRAPフレームのみに関して導出される。現在のフレームのPFOC値が空でない参照パッチフレームリストを導出するように利用されるので、非IRAPフレームに関して、PFOC導出処理、リスト構成処理、およびマーキング処理は、その順序で実行されてよい。
【0132】
第2の課題を解決すべく、HRDには、適合点Aおよび適合点B(タイプI適合性およびタイプII適合性としてもまた知られる)として示される2つの適合点をチェックすることが含まれる。適合点Aに関して、HRDは各サブビットストリームデコーダの出力をチェックする。V-PCCは、ビデオサブビットストリームの各々に関して、インジケートされたビデオコーデックに対応するHRDを利用し得る。V-PCCはまた、パッチ/アトラスサブビットストリームに関してV-PCC固有のHRDを利用し得る。そのような場合、エンコーダは、ビットストリーム/サブビットストリームにおけるシーケンスレベルHRDパラメータのセットをシグナリングし得る。さらに、エンコーダは、SEIメッセージを使用して、バッファリング期間パラメータおよびフレームタイミングパラメータをシグナリングし得る。HRDは次に、シグナリングされたパラメータに基づいてサブビットストリーム上でHRD動作を実行し得る。適合点Bに関して、HRDは再構成された点群フレームの出力をチェックし得る。そのような場合、エンコーダは、ビットストリーム/サブビットストリームにおけるシーケンスレベルHRDパラメータのセットをシグナリングし得る。さらに、エンコーダは、SEIメッセージを使用して、バッファリング期間パラメータおよびAUタイミングパラメータをシグナリングし得る。HRDは次に、シグナリングされたパラメータに基づいてV-PCCビットストリーム全体上でHRD動作を実行し得る。そのようなチェックは、出力が再構成された点群フレームのリストである、AUごとに実行されてよい。
【0133】
第3の問題を解決すべく、最小復号順序制約がいくつかの例示的な実装において利用されてよい。そのような制限は、AU検出を可能にすべく、パッチ/アトラスフレームが、各AU内で第1フレームとして符号化されることを要求することがある。別の例示的な実装において、AU検出を可能にすべく、占有フレームまたはジオメトリフレームが、各AU内で第1フレームとして常に符号化され得る。別の例示的な実装において、AUの開始は、V-PCCユニットヘッダにおけるフラグを使用して、または、V-PCCユニットに関するV-PCC AUデリミタを利用することによって、決定され得る。
【0134】
以下は、本明細書に説明される態様の1または複数の例示的な実装である。以下は例示的な定義である。符号化されたフレームは、パッチ、占有、ジオメトリ、または特定のタイプの属性のV-PCCフレームの符号化された表現である。符号化された点群シーケンス(CPC)は、復号順に、後にIRAP V-PCC AUではない0またはより多くのV-PCC AUが続くIRAP V-PCC AUを含む、V-PCC AUのシーケンスである。CPCSは、全ての後続のV-PCC AUまでを含むが、任意の後続のIRAP V-PCC AUを含まない。IRAP V-PCC AUは、V-PCCユニットを含むV-PCC AUであり、vpcc_irap_flagセットは1に等しい。V-PCCアクセスユニットは、特定の分類規則に従って互いに関連付けられ、復号順に連続しており、ある特定の出力時間に関連する全てのV-PCCユニットを含む、V-PCCユニットのセットである。V-PCCビットストリームは、1または複数のCPCSを形成する符号化された点群フレームおよび関連データの表現を形成するビットのシーケンスである。V-PCCユニットは、後に続くデータのタイプおよびそのデータを含むバイトのインジケーションを含むシンタックス構造である。
【0135】
例示的なV-PCCユニットヘッダシンタックスは以下のようなものである。
【表1】
【0136】
例示的なV-PCCユニットヘッダ意味論は以下のようなものである。vpcc_unit_typeはV-PCCユニットタイプを示す。vpcc_irap_flagは、V-PCCユニットを含む符号化されたフレームがIRAPフレームでないことを指定するように、0に等しく設定されてよい。vpcc_irap_flagは、V-PCCユニットを含む符号化されたフレームがIRAPフレームであることを指定するように、1に等しく設定されてよい。vpcc_unit_typeが、V-PCC Occupancy Video Data(VPCC_OVD)、V-PCC Geometry Video Data(VPCC_GVD)、またはV-PCC Attribute Video Data(VPCC_AVD)に等しいとき、以下があてはまる。識別されたビデオコーデックがAVCであるとき、avcVclNalUnitTypeを、V-PCCユニットペイロードを含むAVCアクセスユニットにおけるVCL NALユニットのAVCネットワーク抽象化層(NAL)ユニットタイプとし、その場合には以下があてはまる。avcVclNalUnitTypeが5に等しい場合、vpcc_irap_flagは1に等しいものとする。そうでない場合は、vpcc_irap_flagは0に等しいものとする。
【0137】
識別されたビデオコーデックがHEVCであるとき、havcVclNalUnitTypeを、V-PCCユニットペイロードを含むHEVCアクセスユニットにおけるVCL NALユニットのHEVC NALユニットタイプとし、その場合には以下があてはまる。havcVclNalUnitTypeの値は、Clean Random Access(CRA) NALユニットタイプ(CRA_NUT)、リーディングピクチャを有するBroken Link Access(BLA)(BLA_W_LP)、ランダムアクセス復号可能リーディング(RADL)ピクチャを有するBLA(BLA_W_RADL)、またはリーディングピクチャを有さないBLA(BLA_N_LP)に等しくないものとする。HEVC CRAピクチャを用いることが許可されなされないときでさえ、ピクチャのオープングループ(GOP)ランダムアクセスポイントは依然として、HEVCリカバリポイントSEIメッセージを使用して、符号化およびシグナリングされるであろう。havcVclNalUnitTypeがRADLピクチャを有するInstantaneous Decoding Refresh(IDR)(IDR_W_RADL)、またはリーディングピクチャを有さないIDR(IDR_N_LP)に等しい場合、vpcc_irap_flagは1に等しいものとする。そうでない場合は、vpcc_irap_flagは0に等しいものとする。
【0138】
識別されたビデオコーデックがVVCである場合、vvcVclNalUnitTypeを、V-PCCユニットペイロードを含むVVCアクセスユニットにおけるVCL NALユニットのVVC NALユニットタイプとし、その場合には以下があてはまる。vvcVclNalUnitTypeの値はCRA_NUTに等しくないものとする。VVC CRAピクチャが用いられることを許可されないときでさえも、open-GOPランダムアクセスポイントは依然として、VVCリカバリポイントSEIメッセージを使用して符号化およびシグナリングされ得る。vvcVclNalUnitTypeがIDR_W_RADLまたはIDR_N_LPに等しい場合、vpcc_irap_flagは1に等しいものとする。そうでない場合は、vpcc_irap_flagは0に等しいものとする。同様の制約が、V-PCC属性サブストリームの符号化のために用いられてよい他のビデオコーデックに関して指定され得る。
【0139】
vpcc_sequence_parameter_set_idは、アクティブなV-PCC SPSに関してsps_sequence_parameter_set_idの値を指定し得る。vpcc_sequence_parameter_set_idの値は、0から15(両端を含む)の範囲に及ぶかもしれない。
【0140】
例示的なパッチタイルグループヘッダ意味論は以下のようなものである。ptgh_typeは、以下のように、現在のパッチタイルグループの符号化タイプを指定する。
【表2】
ptgh_typeへの名前結合
【0141】
vpcc_irap_flagが1に等しいとき、ptgh_typeの値は1に等しいものとする。
【0142】
例示的なパッチフレーム順序カウント導出処理は、以下のようなものである。現在のパッチフレームがIRAPフレームであるとき、変数prevPatchFrmOrderCntLsbおよびprevPatchFrmOrderCntMsbが以下のように導出される。prevPatchFrmは、復号順に、より前にあるパッチフレームとする。変数prevPatchFrmOrderCntLsbは、prevPatchFrmのパッチフレーム順序カウント最下位ビット(LSB)値に等しく設定される。変数prevPatchFrmOrderCntMsbは、prevPatchFrmのPatchFrmOrderCntMsbに等しく設定される。現在のパッチタイルグループの変数PatchFrmOrderCntMsbは、以下のように導出される。現在のパッチフレームがIRAPフレームである場合、PatchFrmOrderCntMsbは0に等しく設定される。
【0143】
例示的な参照パッチフレームリスト構成処理は、各非IRAPパッチフレームに関する復号処理の始まりにおいて呼び出される。例示的な参照パッチフレームマーキング処理は、各非IRAPパッチフレームに関する復号処理の始まりにおいて呼び出される。短期間参照パッチフレームは、それらのPatchFrmOrderCntVal値によって識別される。長期間参照パッチフレームは、それらのPatchFrmOrderCntVal値のLog2(MaxLtPatchFrmOrderCntLsb)最下位ビットによって識別される。現在のパッチフレームがIRAPフレームである場合、全ての参照パッチフレームはDPFB(もしあれば)において現時点で、参照に関して未使用であると示される。そうでない場合は、以下があてはまる。RefPatchFrmListにおける各長期間参照パッチフレームエントリに関して、参照されるパッチフレームが短期間参照パッチフレームであるとき、パッチフレームは長期間参照に関して用いられるとして示される。RefPatchFrmListにおけるいかなるエントリによっても参照されない、DPFBにおける各参照パッチフレームは、参照に関して未使用であると示される。
【0144】
図11は、例示的なビデオ符号化デバイス1100の概略図である。ビデオ符号化デバイス1100は、本明細書で説明されるような開示された例/実施形態を実装するために好適である。ビデオ符号化デバイス1100は、ネットワークでデータをアップストリームおよび/またはダウンストリームで通信するように、ダウンストリームポート1120、アップストリームポート1150、および/または、送信機および/または受信機を含む送受信機ユニット(Tx/Rx)1110を含む。ビデオ符号化デバイス1100はまた、論理ユニットを含むプロセッサ1130、および/または、データを処理する中央演算処理装置(CPU)、およびデータを格納するためのメモリ1132を含む。ビデオ符号化デバイス1100はまた、電気、光/電気(OE)構成要素、電気/光(EO)構成要素、および/または、電気、光、または無線通信ネットワークを介してデータの通信のためにアップストリームポート1150および/またはダウンストリームポート1120に結合された無線通信構成要素を含む。ビデオ符号化デバイス1100はまた、ユーザとの間でデータを通信するための入力および/または出力(I/O)デバイス1160も含んでよい。I/Oデバイス1160は、ビデオデータを表示するためのディスプレイ、音声データを出力するためのスピーカなどの出力デバイスを含んでよい。I/Oデバイス1160はまた、キーボード、マウス、トラックボールなどの入力デバイス、および/またはそのような出力デバイスとインタラクトするための対応するインタフェースも含んでよい。
【0145】
プロセッサ1130はハードウェアおよびソフトウェアによって実装される。プロセッサ1130は、1または複数のCPUチップ、コア(例えば、マルチコアプロセッサとして)、フィールドプログラマブルゲートアレイ(FPGA)、特定用途向け集積回路(ASIC)、およびデジタル信号プロセッサ(DSP)として実装されてよい。プロセッサ1130は、ダウンストリームポート1120、Tx/Rx1110、アップストリームポート1150、およびメモリ1132と通信する。プロセッサ1130は符号化モジュール1114を含む。符号化モジュール1114は、方法100、1200および1300などの、本明細書で説明される開示される実施形態を実装し、それらは、パッチ603のセットに分離され、PCCビットストリーム1000において占有フレーム710、ジオメトリフレーム720、アトラスフレーム730に符号化される点群媒体500を利用し得る。さらに、符号化モジュール1114は、PCCビットストリーム1000上で適合性テスト機構800を実行するHRD900を実装し得る。符号化モジュール1114はまた、本明細書で説明される任意の他の方法/機構を実装し得る。さらに、符号化モジュール1114は、コーデックシステム200、エンコーダ300、および/またはデコーダ400を実装し得る。例えば、符号化モジュール1114は、バッファリング期間SEIメッセージ、HRDパラメータ、および/またはアトラスフレームタイミングSEIメッセージをPCCビットストリームに符号化し得る。さらに、符号化モジュール1114はHRDを初期化し得、バッファリング期間SEIメッセージ、HRDパラメータ、および/またはアトラスフレームタイミングSEIメッセージに基づいて、PCCビットストリーム上でHRD適合性テストを実行し得る。さらに、符号化モジュール1114は、バッファリング期間SEIメッセージ、HRDパラメータ、および/またはアトラスフレームタイミングSEIメッセージに基づいて、HRD適合性に関してテストされるPCCビットストリームを復号し得る。したがって、符号化モジュール1114は、ビデオ符号化デバイス1100に、追加的な機能性、および/または、ビデオデータを符号化するときの符号化効率を提供させる。したがって、符号化モジュール1114は、ビデオ符号化デバイス1100の機能を改善し、ならびに、ビデオ符号化技術に特有の問題に対処する。さらに、符号化モジュール1114は、ビデオ符号化デバイス1100を別の状態に変換する効果を有する。あるいは、符号化モジュール1114は、メモリ1132に格納された命令として実装され得、(例えば、非一時的媒体に格納されたコンピュータプログラム製品として)プロセッサ1130によって実行され得る。
【0146】
メモリ1132は、ディスク、テープドライブ、ソリッドステートドライブ、リードオンリメモリ(ROM)、ランダムアクセスメモリ(RAM)、フラッシュメモリ、三値連想メモリ(TCAM)、およびスタティックランダムアクセスメモリ(SRAM)などの、1または複数のメモリタイプを含む。メモリ1132は、プログラムが実行のために選択されるときにそのようなプログラムを格納するように、および、プログラム実行の最中に読み出される命令またはデータを格納するように、オーバーフローデータストレージデバイスとして用いられ得る。
【0147】
図12は、例えば、適合性テスト機構800に従ってHRD900によるHRD適合性テストをサポートするように、HRDを初期化する際に用いるための、PCCビットストリーム1000などのPCCビットストリームを符号化する例示的な方法1200のフローチャートである。方法1200は、コーデックシステム200、エンコーダ300、および/または、方法100を実行するときのビデオ符号化デバイス1100などのエンコーダによって利用され得る。したがって、方法1200は、点群媒体500上で動作してよく、それはパッチ603のセットに分離され、占有フレーム710、ジオメトリフレーム720、およびアトラスフレーム730に符号化される。
【0148】
方法1200は、エンコーダが、複数のフレームにわたって動的に変化する点群を含む映像シーケンスを受信し、その映像シーケンスを、例えばユーザ入力に基づいてPCCビットストリームに符号化することを決定したときに、始まってよい。段階1201において、エンコーダは、PCC成分のシーケンスをビットストリームに符号化する。このような構成要素は、AUにおけるPCCフレームのシーケンスを含み得る。さらに、PCC フレーム/AUは各々、アトラスフレーム、占有フレーム、ジオメトリマップフレーム、および/または属性フレームを含み得る。
【0149】
段階1203において、エンコーダは、バッファリング期間SEIメッセージをビットストリームに符号化し得る。エンコーダはまた、HRDパラメータをビットストリームに符号化し得る。さらに、エンコーダは、アトラスフレームタイミングSEIメッセージをビットストリームに符号化し得る。上記に説明されるように、バッファリング期間SEIメッセージ、HRDパラメータ、およびアトラスフレームタイミングSEIメッセージは、ビットストリーム上で適合性チェックを実行するのに十分な情報を提供し得る。
【0150】
段階1205において、エンコーダは、バッファリング期間SEIメッセージに関連付けられた符号化アトラスAUにおいてHRDを初期化し得る。例えば、符号化アトラスAUは第1のPCC AUおよび/またはビットストリームにおける第1のアトラスフレームを含み得、HRDは、バッファリング期間SEIメッセージによって示されるAU/フレームにおいて適合性チェックの実行を始め得る。さらに、バッファリング期間SEIメッセージは、HRDにおけるCABに関する初期除去遅延を示し得る。HRDはまた、アトラスフレームタイミングSEIメッセージによって指定されるように、HRDにおけるDABの出力遅延を設定し得る。
【0151】
段階1207において、エンコーダは、HRDパラメータに基づいてHRDにおけるHRD適合性チェックに関する適合点を選択し得る。例えば、HRD適合性チェックは、タイプI適合性テストまたはタイプII適合性テストであり得る。したがって、HRDパラメータは、第1タイプの適合点(例えば、タイプI適合性テスト)を選択するように、第1の値を設定し得る。HRD適合性チェックは次に、HRDパラメータに基づくPCC成分に含まれる、解凍された属性成分、解凍されたアトラス成分、解凍された占有マップ成分、および解凍されたジオメトリ成分上で実行され得る。さらに、HRDパラメータは、第2タイプの適合点(例えば、タイプII適合性テスト)を選択するように、第2の値に設定され得る。HRD適合性チェックは次に、HRDパラメータに基づいて、PCC成分から生成される再構成された点群上で実行され得る。
【0152】
段階1209において、HRDは、バッファリング期間SEIメッセージによって示されるように、符号化アトラスAUにおいて開始するビットストリームのHRD適合性チェックを実行する。さらに、HRDは、HRDパラメータによって示される適合点において適合性チェックを実行する。
【0153】
段階1211において、HRDは、バッファリング期間SEIメッセージによって指定される初期遅延に基づいて、およびアトラスフレームタイミングSEIメッセージにおいて指定されるCAB除去遅延に基づいて、HRD適合性チェックの最中のHRDにおけるCABから復号ユニットを除去し得る。本明細書で用いられるように、復号ユニットは、復号のためにCABなどのバッファに格納されたビットストリームまたはサブビットストリームからの、任意の符号化された成分である。さらに、初期遅延は、CAB除去遅延が変わり得る間の第1のフレーム/AUに関してよく、第1のフレーム/AUの後にチェックされた成分に関してよい。
【0154】
段階1213において、エンコーダおよび/またはHRDはデコーダに向けて通信するためのビットストリームを格納し得る。
【0155】
図13は、例えば、適合性テスト機構800に従ってHRD900による成功したHRD適合性テストから得られる、PCCビットストリーム1000などのPCCビットストリームを復号する例示的な方法1300のフローチャートである。方法1300は、コーデックシステム200、デコーダ400、および/または、方法100を実行するときのビデオ符号化デバイス1100などのデコーダによって利用され得る。したがって、方法1300は、点群媒体500上で動作してよく、それはパッチ603のセットに分離され、占有フレーム710、ジオメトリフレーム720、およびアトラスフレーム730に符号化される。
【0156】
方法1300は、デコーダが、例えば方法1200の結果としての、点群の映像シーケンスを表す符号化されたデータのPCCビットストリームを受信し始めたときに、始まってよい。段階1301において、デコーダは、PCC成分の複数の符号化されたシーケンスを含むビットストリームを受信する。このような構成要素は、AUにおけるPCCフレームのシーケンスを含む。さらに、PCC フレーム/AUは、アトラスフレーム、占有フレーム、ジオメトリマップフレーム、および/または属性フレームを各々含み得る。さらに、ビットストリームは、バッファリング期間SEIメッセージ、HRDパラメータ、およびアトラスフレームタイミングSEIメッセージを含み得る。バッファリング期間SEIメッセージは、エンコーダにおいてHRDにおけるCABから復号ユニットを除去するための初期遅延を含み得る。HRDパラメータは、HRDにおけるHRD適合性チェックに関する適合点を指定し得る。適合点は、HRD適合性チェックが、解凍されたPCC成分または再構成された点群上で実行されるかどうかを示す。アトラスフレームタイミングSEIメッセージは、HRDにおけるCABから復号ユニットを、および/または、HRDにおけるDABから出力遅延を除去するパラメータを指定し得る。デコーダは、ビットストリームがHRD適合性テストをパスし、したがって、デコーダによって復号可能であることを、それらのメッセージの1または複数から推測し得る。
【0157】
段階1303において、デコーダは、バッファリング期間SEIメッセージによって示される符号化アトラスアクセスユニットから開始するPCC成分の復号を始め得る。PCC成分は、アトラスフレーム、占有フレーム、ジオメトリマップフレーム、および/または属性フレームを各々がさらに含む、PCCフレームを含み得る。デコーダはPCC成分を復号し、次に、点群のシーケンスを再構成する。デコーダは次に、段階1305においての表示のためにPCC成分から再構成された点群を転送し得る。
【0158】
図14は、例えば、適合性テスト機構800に従ってHRD900によって、HRD適合性テストをサポートするためにPCCビットストリーム1000を符号化する例示的システム1400の概略図である。システム1400は、コーデックシステム200、エンコーダ300、デコーダ400、および/またはビデオ符号化デバイス1100などの、エンコーダおよびデコーダによって実装され得る。したがって、システム1400は点群媒体500上で動作し得、それは、パッチ603のセットに分離され、占有フレーム710、ジオメトリフレーム720、およびアトラスフレーム730に符号化される。さらに、システム1400は、方法100、1200および/または1300を実装するときに利用され得る。
【0159】
システム1400は、ビデオエンコーダ1402を含む。ビデオエンコーダ1402は、PCC成分のシーケンスをビットストリームに符号化する符号化モジュール1403を含む。符号化モジュール1403はさらに、バッファリング期間SEIメッセージをビットストリームに符号化する。ビデオエンコーダ1402はさらに、バッファリング期間SEIメッセージに関連付けられた符号化アトラスAUにおいてHRDを初期化する初期化モジュール1404を含む。ビデオエンコーダ1402はさらに、符号化アトラスAUにおいて開始するビットストリームのHRD適合性チェックを実行するHRDモジュール1405を含む。ビデオエンコーダ1402はさらに、デコーダに向けて通信するためにビットストリームを格納する格納モジュール1406を含む。ビデオエンコーダ1402はさらに、ビデオデコーダ1410に向けてビットストリームを伝送する送信モジュール1407を含む。ビデオエンコーダ1402はさらに、方法1200の任意の段階を実行するように構成され得る。
【0160】
システム1400はまた、ビデオデコーダ1410を含む。ビデオデコーダ1410は、PCC成分の複数の符号化されたシーケンスおよびバッファリング期間SEIメッセージを含むビットストリームを受信する受信モジュール1411を含む。ビデオデコーダ1410はさらに、バッファリング期間SEIメッセージによって示される符号化アトラスアクセスユニットから開始するPCC成分を復号する復号モジュール1413を含む。ビデオデコーダ1410はさらに、表示のためにPCC成分から再構成された点群を転送する転送モジュール1415を含む。ビデオデコーダ1410はさらに、方法1300の任意の段階を実行するように構成され得る。
【0161】
第1成分と第2成分との間に、線、トレース、または別の媒体以外に、介入する成分がないとき、第1成分は、第2成分と直接結合される。第1成分と第2成分との間に、線、トレース、または別の媒体とは他の、介入する成分があるとき、第1成分は第2成分と間接的に結合される。用語「結合(coupled)」およびその変形は、直接結合と間接的結合の両方を含む。用語「約(about)」を用いることは、別の方法で述べられない限り、後続の数の±10%を含む範囲に及ぶという意味である。
【0162】
本明細書に記載された例示的な方法の段階は、必ずしも説明された順序で実行される必要はないこともまた、理解されるべきであり、このような方法の段階の順序は、単なる例示的なものとして理解されるべきである。同様に、追加の段階がこのような方法に含まれてよく、特定のステップが、本開示の様々な実施形態において一貫した方法において、省略または組み合されてよい。
【0163】
本開示においていくつかの実施形態が提供されたが、開示されたシステムおよび方法は、本開示の趣旨または範囲から逸脱することなく、他の多数の具体的な形態で実施され得ることが理解されるであろう。本例は、限定的なものではなく例示的なものとみなされるべきであり、本明細書に提示される詳細に限定することは意図していない。例えば、様々な要素または構成要素が別のシステム内において組み合わされ得るか、若しくは、統合され得る。または、一定の特徴は省略され得るか、若しくは、実装されないことがあり得る。
【0164】
さらに、様々な実施形態において分離したものまたは別個のものとして説明され示された、技法、システム、サブシステム、および方法は、本開示の範囲から逸脱することなく、他のシステム、構成要素、技法、または方法と組み合わされても統合されてもよい。変更、置き換え、および修正に関する他の実施例が当業者によって確認可能であり、これらの実施例が、本明細書に開示された趣旨および範囲から逸脱することなく作成されてよい。
[他の可能な請求項]
(項目1)
エンコーダにおいて実装される方法であって、方法は、
上記エンコーダのプロセッサが、バッファリング期間追加拡大情報(SEI)メッセージと、点群圧縮(PCC)成分のシーケンスとを、ビットストリームに符号化する段階と、
上記プロセッサが、上記バッファリング期間SEIメッセージに関連付けられた符号化アトラスアクセスユニット(AU)において仮想参照デコーダ(HRD)を、初期化する段階と、
上記プロセッサが、上記符号化アトラスAUにおいて開始する上記ビットストリームのHRD適合性チェックを実行する段階と、
を含む、方法。
(項目2)
上記プロセッサが、仮想参照デコーダ(HRD)パラメータを上記ビットストリームに符号化する段階をさらに備える、項目1に記載の方法。
(項目3)
上記プロセッサが、上記HRDパラメータに基づいて上記HRDにおける上記HRD適合性チェックの適合点を選択する段階をさらに備える、項目1または2に記載の方法。
(項目4)
第1タイプの適合点が、上記HRDパラメータに基づいて選択されるとき、上記HRD適合性チェックが、解凍された属性成分上で、解凍されたアトラス成分上で、解凍された占有マップ成分上で、および上記PCC成分の解凍されたジオメトリ成分上で実行される、項目1-3のいずれか一項に記載の方法。
(項目5)
第2タイプの適合点が、上記HRDパラメータに基づいて選択されるとき、上記HRD適合性チェックが上記PCC成分の再構成された点群上で実行される、項目1-4のいずれか一項に記載の方法。
(項目6)
上記プロセッサが、アトラスフレームタイミングSEIメッセージを上記ビットストリームに符号化することをさらに備える、項目1-5のいずれか一項に記載の方法。
(項目7)
上記プロセッサが、上記アトラスフレームタイミングSEIメッセージによって指定されたように、上記HRD適合性チェックの最中に上記HRDにおける符号化されたアトラスバッファ(CAB)から復号ユニットを除去する段階を、さらに備える、項目1-6のいずれか一項に記載の方法。
(項目8)
上記アトラスフレームタイミングSEIメッセージによって指定されたように、上記HRDにおける復号されたアトラスバッファ(DAB)の出力遅延を設定する段階をさらに備える、項目1-7のいずれか一項に記載の方法。
(項目9)
上記復号ユニットが、上記バッファリング期間SEIメッセージによって指定された初期遅延に基づいて、上記HRD適合性チェックの最中に上記HRDにおける上記CABから除去される、項目1-8のいずれか一項に記載の方法。
(項目10)
デコーダにおいて実装される方法であって、方法は、
上記デコーダの受信機が、点群圧縮(PCC)成分の複数の符号化されたシーケンスおよびバッファリング期間追加拡大情報(SEI)メッセージを含むビットストリームを受信する段階と、
上記デコーダのプロセッサが、上記バッファリング期間SEIメッセージによって示される符号化アトラスアクセスユニットから開始される上記PCC成分を復号する段階と、
を備える、方法。
(項目11)
上記バッファリング期間SEIメッセージが、仮想参照デコーダ(HRD)において符号化されたアトラスバッファ(CAB)から復号ユニットを除去するための初期遅延を含む、項目10に記載の方法。
(項目12)
上記ビットストリームが、HRDパラメータをさらに含む、項目10または11に記載の方法。
(項目13)
上記HRDパラメータが、上記HRDにおいてHRD適合性チェックに関する適合点を指定する、項目10-12のいずれか一項に記載の方法。
(項目14)
上記適合点が、上記HRD適合性チェックが解凍されたPCC成分上で、または再構成された点群上で実行されるかどうかを示す、項目10-13のいずれか一項に記載の方法。
(項目15)
上記ビットストリームが、アトラスフレームタイミングSEIメッセージをさらに含む、項目10-14のいずれか一項に記載の方法。
(項目16)
上記アトラスフレームタイミングSEIメッセージが、HRDにおけるCABから復号ユニットを除去するためのパラメータを指定する、項目10-15のいずれか一項に記載の方法。
(項目17)
プロセッサ、上記プロセッサに結合される受信機、上記プロセッサに結合されるメモリ、および上記プロセッサに結合される送信機を含む、ビデオ符号化デバイスであって、上記プロセッサ、上記受信機、上記メモリ、および送信機は、項目1-16のいずれか一項に記載の方法を実行するように構成される、
ビデオ符号化デバイス。
(項目18)
ビデオ符号化デバイスによって用いるためのコンピュータプログラム製品を含む非一時的コンピュータ可読媒体であって、上記コンピュータ実施可能な命令を備えるコンピュータプログラム製品は、プロセッサによって実行されたとき、項目1-16のいずれか一項に記載の方法を上記ビデオ符号化デバイスに実行させるように、上記非一時的コンピュータ可読媒体に格納される、非一時的コンピュータ可読媒体。
(項目19)
点群圧縮(PCC)成分の複数の符号化されたシーケンスと、バッファリング期間追加拡大情報(SEI)メッセージとを含むビットストリームを受信する受信手段と、
上記バッファリング期間SEIメッセージによって示される符号化アトラスアクセスユニットから開始する上記PCC成分を復号する復号手段と、
表示のために上記PCC成分から再構成された点群を転送する転送手段と、
を備える、デコーダ。
(項目20)
上記デコーダがさらに、項目10-16のいずれか一項に記載の方法を実行するように構成される、項目19に記載のデコーダ。
(項目21)
バッファリング期間追加拡大情報(SEI)メッセージおよび点群圧縮(PCC)成分のシーケンスをビットストリームに符号化する符号化手段と、
上記バッファリング期間SEIメッセージに関連付けられる符号化アトラスアクセスユニット(AU)において仮想参照デコーダ(HRD)を初期化する初期化手段と、
上記符号化アトラスAUにおいて開始する上記ビットストリームのHRD適合性チェックを実行するHRD手段と、
デコーダに向けて通信するように上記ビットストリームを格納する格納手段と、
を含む、エンコーダ。
(項目22)
上記エンコーダはさらに、項目1-9のいずれか一項に記載の方法を実行するように構成される、項目19に記載のエンコーダ。