(19)【発行国】日本国特許庁(JP)
(12)【公報種別】特許公報(B2)
(11)【特許番号】
(24)【登録日】2024-05-10
(45)【発行日】2024-05-20
(54)【発明の名称】HAARベースの点群符号化のための方法および装置
(51)【国際特許分類】
H04N 19/13 20140101AFI20240513BHJP
H04N 19/597 20140101ALI20240513BHJP
H04N 19/70 20140101ALI20240513BHJP
【FI】
H04N19/13
H04N19/597
H04N19/70
(21)【出願番号】P 2022560380
(86)(22)【出願日】2021-09-08
(86)【国際出願番号】 US2021049519
(87)【国際公開番号】W WO2022191872
(87)【国際公開日】2022-09-15
【審査請求日】2022-10-03
(32)【優先日】2021-03-10
(33)【優先権主張国・地域又は機関】US
(32)【優先日】2021-08-27
(33)【優先権主張国・地域又は機関】US
(73)【特許権者】
【識別番号】520353802
【氏名又は名称】テンセント・アメリカ・エルエルシー
(74)【代理人】
【識別番号】100110364
【氏名又は名称】実広 信哉
(74)【代理人】
【識別番号】100150197
【氏名又は名称】松尾 直樹
(72)【発明者】
【氏名】ウェン・ガオ
(72)【発明者】
【氏名】シャン・ジャン
(72)【発明者】
【氏名】シャン・リュウ
【審査官】田中 純一
(56)【参考文献】
【文献】国際公開第2020/162495(WO,A1)
【文献】米国特許出願公開第2021/0368186(US,A1)
【文献】米国特許出願公開第2017/0347122(US,A1)
【文献】特開2011-024066(JP,A)
【文献】特表2023-541207(JP,A)
(58)【調査した分野】(Int.Cl.,DB名)
H04N 7/12
H04N 19/00 - 19/98
G06T 1/00 - 1/40
G06T 3/00 - 5/50
G06T 9/00 - 9/40
IEEE Xplore
(57)【特許請求の範囲】
【請求項1】
点群デコーダにおける点群属性デコーディングの方法であって、
点群の点のセットのソート方法を決定するステップと、
前記点群の符号化ビットストリーム内の第1のシグナリング情報に基づいて、前記点群のHaarベースの属性符号化の変換係数を量子化するための量子化パラメータを決定するステップであって、前記Haarベースの属性符号化は、Haar変換に基づいて、前記点群の前記点のセットに対して点群圧縮を実行するように構成される、ステップと、
前記第1のシグナリング情報に基づいて決定された前記量子化パラメータに従って
量子化された前記変換係数をデコードするためのエントロピーデコーディング方法を決定するステップと、
前記エントロピーデコーディング方法に基づいて
量子化された前記変換係数を決定するステップと、
前記決定されたソート方法および前記決定された量子化
された変換係数に基づいて前記点群の属性を再構成するステップと
を含む、方法。
【請求項2】
前記ソート方法を決定する前記ステップが、
前記点群の前記符号化ビットストリーム内の第2のシグナリング情報に基づいて、前記点群の前記点のセットの前記ソート方法を決定するステップ
をさらに含み、
前記ソート方法は、第1の値に等しい前記第2のシグナリング情報に基づくMortonソートであり、
前記ソート方法は、第2の値に等しい前記第2のシグナリング情報に基づくHilbertソートである、
請求項1に記載の方法。
【請求項3】
前記第1のシグナリング情報が、前記量子化パラメータ、前記点群の用途、および前記点群の特性のうちの1つに基づいて設定される、請求項1に記載の方法。
【請求項4】
前記エントロピーデコーディング方法を決定する前記ステップが、
指数ゴロム符号化である前記エントロピーデコーディング方法に基づいて、
前記符号化ビットストリーム内の第3のシグナリング情報に基づいて前記指数ゴロム符号化の次数kを決定するステップであって、前記第3のシグナリング情報は前記指数ゴロム符号化の前記次数kを示す、ステップ
をさらに含む、請求項1に記載の方法。
【請求項5】
前記エントロピーデコーディング方法を決定する前記ステップが、
指数ゴロム符号化である前記エントロピーデコーディング方法に基づいて、
前記量子化パラメータに基づいて前記指数ゴロム符号化の次数kを決定するステップであって、前記次数は
【数1】
であり、max_kは量子化された
前記変換係数をデコードするための前記指数ゴロム符号化の最大次数であり、trans_coeff_qpは前記量子化パラメータの値であり、sは6および8のうちの1つに等しい正の整数である、ステップ
をさらに含む、請求項1に記載の方法。
【請求項6】
量子化された前記変換係数を決定する前記ステップが、
前記指数ゴロム符号化、および前記指数ゴロム符号化の前記決定された次数kに基づいて、
量子化された前記変換係数の絶対値から閾値を減算したものをデコードするステップであって、前記閾値は、1、2、および3のうちの1つに等しい、ステップ
をさらに含む、請求項4に記載の方法。
【請求項7】
量子化された前記変換係数を決定する前記ステップが、
量子化された前記変換係数の第1の量子化変換係数xをデコードするステップであって、前記第1の量子化変換係数xは、前記次数kが0に等しい前記指数ゴロム符号化を使用して第1の部分
【数2】
が符号化され、第2の部分(x modulo 2
k)がバイナリ形式で符号化されるように、前記指数ゴロム符号化によって符号化される、ステップ
をさらに含む、請求項4に記載の方法。
【請求項8】
前記決定されたソート方法に基づいて前記点群の前記点のセットをソートするステップと、
前記符号化ビットストリーム内のシグナリング情報の分割によって示される分割サイズに基づいて、前記点群の前記ソートされた点のセットを複数のセグメントに分割するステップと、
前記決定された量子化
された変換係数に基づいて前記点群の前記複数のセグメントの各々を再構成するステップと
をさらに含む、請求項2に記載の方法。
【請求項9】
前記複数のセグメントの数が
【数3】
に等しく、Nは前記点群における前記点のセットの数であり、Mは正の整数である、請求項8に記載の方法。
【請求項10】
再構成する前記ステップが、
前記Haarベースの属性符号化に関連付けられたHaar変換行列の1/2のスケーリング係数を決定するステップと、
前記Haarベースの属性符号化に基づいて変換係数を取得するために、
量子化された前記変換係数に対して逆量子化演算を実行するステップと、
属性残差を取得するために、前記Haar変換行列および前記変換係数に基づいて前記点群に対して逆変換演算を実行するステップと、
前記Haarベースの属性符号化によって得られた前記点群の前記属性残差および予測属性に基づいて前記点群の前記属性を再構成するステップと
をさらに含む、請求項1に記載の方法。
【請求項11】
請求項1~10のいずれか一項に記載の方法を行うように構成された装置。
【発明の詳細な説明】
【技術分野】
【0001】
関連出願の相互参照
本出願は、2021年8月27日に出願された米国特許出願第17/446,263号「METHOD AND APPARATUS FOR HAAR-BASED POINT CLOUD CODING」に対する優先権の利益を主張し、同出願は、2021年3月10日に出願された米国仮出願第63/159,409号「ON HAAR-BASED ATTRIBUTE CODING FOR POINT CLOUDS」に対する優先権の利益を主張する。先の出願の開示全体は、参照によりその全体が本明細書に組み込まれる。
【0002】
本開示は、点群のためのHaarベースの属性符号化の改善を含む、点群符号化に一般的に関連する実施形態を説明する。
【背景技術】
【0003】
本明細書で提供される背景技術の説明は、本開示の文脈を一般的に提示することを目的としている。本発明者らの研究は、この研究がこの背景技術の項で説明されている限りにおいて、および出願時に従来技術と見なされ得ない説明の態様は、本開示に対する従来技術として明示的にも暗示的にも認められない。
【0004】
3次元(3D)空間における世界のオブジェクト、世界の環境などの世界をキャプチャし表現するための様々な技術が開発されている。世界の3D表現は、より没入型のインタラクションおよびコミュニケーションを可能にすることができる。点群を、世界の3D表現として使用することができる。点群は、3D空間内の点のセットであり、各々が、例えば色、材料特性、テクスチャ情報、強度属性、反射率属性、動き関連属性、モダリティ属性、および/または様々な他の属性などの関連属性を有する。このような点群は、大量のデータを含む場合があり、格納し、送信するためにコストがかかり、時間がかかる可能性がある。
【発明の概要】
【課題を解決するための手段】
【0005】
本開示の態様は、点群の圧縮および解凍のための方法および装置を提供する。本開示の一態様によれば、点群デコーダにおける点群属性デコーディングの方法が提供される。本方法では、点群の点のセットのソート方法を決定することができる。点群のHaarベースの属性符号化の変換係数を量子化するための量子化パラメータは、点群の符号化ビットストリーム内の第1のシグナリング情報に基づいて決定され得る。Haarベースの属性符号化は、Haar変換に基づいて点群の点のセットに対して点群圧縮を実行するように構成され得る。量子化変換係数をデコードするためのエントロピーデコーディング方法は、第1のシグナリング情報に基づいて決定された量子化パラメータに従って決定され得る。量子化変換係数は、エントロピーデコーディング方法に基づいてさらに決定され得る。点群の属性は、決定されたソート方法および決定された量子化変換係数に基づいて再構成され得る。
【0006】
一例では、ソート方法は、点群の符号化ビットストリーム内の第2のシグナリング情報に基づいて決定され得る。ソート方法は、第1の値に等しい第2のシグナリング情報に基づくMortonソートとすることができる。別の例では、ソート方法は、第2の値に等しい第2のシグナリング情報に基づいてHilbertソートであると判定され得る。
【0007】
いくつかの実施形態では、第1のシグナリング情報は、量子化パラメータ、点群の用途、および点群の特性のうちの1つに基づいて設定され得る。
【0008】
本方法では、エントロピーデコーディング方法が指数ゴロム符号化である場合、指数ゴロム符号化の次数kを、符号化ビットストリーム内の第3のシグナリング情報に基づいて決定することができ、第3のシグナリング情報は指数ゴロム符号化の次数kを示す。
【0009】
本方法では、エントロピーデコーディング方法が指数ゴロム符号化である場合、量子化パラメータに基づいて指数ゴロム符号化の次数kを決定することができる。したがって、次数は
【数1】
である。max_kは、量子化変換係数をデコードするための指数ゴロム符号化の最大次数であり、trans_coeff_qpは、量子化パラメータの値であり、sは、6および8のいずれかに等しい正の整数である。
【0010】
いくつかの実施形態では、エントロピーデコーディング方法に基づいて量子化変換係数を決定するために、指数ゴロム符号化および指数ゴロム符号化の決定された次数kに基づいて、閾値を減算した量子化変換係数の絶対値をデコードすることができる。閾値は、1、2、および3のうちの1つに等しくすることができる。
【0011】
いくつかの実施形態では、エントロピーデコーディング方法に基づいて量子化変換係数を決定するために、量子化変換係数の第1の量子化変換係数xをデコードすることができる。第1の量子化変換係数xを指数ゴロム符号化によって符号化することができ、その結果、第1の部分
【数2】
は、次数kが0に等しい指数ゴロム符号化を使用して符号化され、第2の部分(x modulo 2
k)がバイナリ形式で符号化される。
【0012】
本方法では、決定されたソート方法に基づいて、点群の点のセットをソートすることができる。符号化ビットストリーム内のシグナリング情報の分割によって示される分割サイズに基づいて、点群のソートされた点のセットを複数のセグメントにさらに分割することができる。点群の複数のセグメントの各々は、決定された量子化変換係数にそれぞれ基づいて再構成され得る。
【0013】
いくつかの実施形態では、複数のセグメントの数は
【数3】
に等しくすることができ、Nは点群内の点のセットの数とすることができ、Mは正の整数とすることができる。
【数4】
は、N/M以上の整数とすることができる。
【0014】
本方法では、点群を再構成するために、Haarベースの属性符号化に関連するHaar変換行列の1/2のスケーリング係数を決定することができる。Haarベースの属性符号化に基づいて変換係数を取得するために、量子化変換係数に対して逆量子化演算を実行することができる。Haar変換行列および変換係数に基づいて点群に対して逆変換演算を実行して、属性残差を取得することができる。Haarベースの属性符号化によって得られた点群の属性残差および予測属性に基づいて、点群の属性をさらに再構成することができる。
【0015】
点群データを処理するための装置は、上記の方法を実行するように構成される。例えば、点群データを処理するための装置は、上述した方法のうちの1つまたは複数を実行するように構成された受信回路および処理回路を含む。例えば、装置は、点群の符号化ビットストリーム内の第1のシグナリング情報に基づいて、点群の点のセットのソート方法を決定するように構成された処理回路を含むことができる。処理回路はまた、点群の符号化ビットストリーム内の第2のシグナリング情報に基づいて、点群のHaarベースの属性符号化の変換係数を量子化するための量子化パラメータを決定するように構成され得る。処理回路は、第2のシグナリング情報に基づいて決定された量子化パラメータに従って量子化変換係数をデコードするためのエントロピーデコーディング方法を決定するように構成され得る。処理回路は、エントロピーデコーディング方法に基づいて量子化変換係数を決定するようにさらに構成され得る。処理回路は、決定されたソート方法および決定された量子化変換係数に基づいて点群の属性を再構成するように構成され得る。
【0016】
いくつかの実施形態では、処理回路は、決定されたソート方法に基づいて点群の点のセットをソートするようにさらに構成され得る。次いで、処理回路は、符号化ビットストリーム内のシグナリング情報の分割によって示される分割サイズに基づいて、点群のソートされた点のセットを複数のセグメントに分割するように構成され得る。その後、処理回路は、決定された量子化変換係数に基づいて点群の複数のセグメントの各々を再構成するように構成され得る。いくつかの実施形態では、複数のセグメントの数は、
【数5】
に等しい。Nは点群における点のセットの数とすることができ、Mは正の整数とすることができる。
【数6】
は、N/M以上の整数とすることができる。
【0017】
本開示の一態様によれば、非一時的コンピュータ可読記憶媒体が提供される。非一時的コンピュータ可読記憶媒体は、少なくとも1つのプロセッサによって実行されると、少なくとも1つのプロセッサに上述の方法のうちの1つまたは複数を実行させる命令を格納する。例えば、本方法では、点群の符号化ビットストリーム内の第1のシグナリング情報に基づいて、点群の点のセットのソート方法を決定することができる。点群のHaarベースの属性符号化の変換係数を量子化するための量子化パラメータは、点群の符号化ビットストリーム内の第2のシグナリング情報に基づいて決定され得る。量子化変換係数をデコードするためのエントロピーデコーディング方法は、第2のシグナリング情報に基づいて決定された量子化パラメータに従って決定され得る。量子化変換係数は、エントロピーデコーディング方法に基づいてさらに決定され得る。点群の属性は、決定されたソート方法および決定された量子化変換係数に基づいて再構成され得る。
【0018】
開示される主題のさらなる特徴、性質、および様々な利点は、以下の詳細な説明および添付の図面からより明らかになる。
【図面の簡単な説明】
【0019】
【
図1】一実施形態による通信システムの簡略化されたブロック図の概略図である。
【
図2】一実施形態によるストリーミングシステムの簡略化されたブロック図の概略図である。
【
図3】いくつかの実施形態による、点群フレームをエンコードするためのエンコーダのブロック図である。
【
図4】いくつかの実施形態による、点群フレームに対応する圧縮されたビットストリームをデコードするためのデコーダのブロック図である。
【
図5】いくつかの実施形態による、点群フレームをエンコードするためのエンコーダのブロック図である。
【
図6】いくつかの実施形態による、点群フレームに対応する圧縮されたビットストリームをデコードするためのデコーダのブロック図である。
【
図7】いくつかの実施形態によるリフティングベースの属性符号化における順変換のブロック図である。
【
図8】いくつかの実施形態によるリフティングベースの属性符号化における逆変換のブロック図である。
【
図9A】本開示のいくつかの実施形態による、領域適応階層変換(RAHT)ベースの属性符号化における順変換を示す図である。
【
図9B】本開示のいくつかの実施形態による、領域適応階層変換(RAHT)ベースの属性符号化における逆変換を示す図である。
【
図10】本開示のいくつかの実施形態による、点群をセグメントに分割するブロック図である。
【
図11】いくつかの実施形態による、例示的なデコーディングプロセスの概要を示すフローチャートである。
【
図12】一実施形態によるコンピュータシステムの概略図である。
【発明を実施するための形態】
【0020】
点群は、近年、より広く使用されるようになってきている。例えば、点群は、オブジェクト検出および位置特定のための自動運転車両で使用され得る。点群はまた、マッピングのための地理情報システム(GIS)で使用され得、文化財のオブジェクトおよびコレクションを視覚化およびアーカイブするために文化財で使用され得る。
【0021】
点群は、典型的には3次元(3D)の高次元点のセットを含むことができる。高次元点の各々は、3D位置情報および色、反射率などの追加の属性を含むことができる。高次元点を、複数のカメラおよび深度センサ、または様々な設定のLidarを使用してキャプチャすることができ、元のシーンを現実的に表現するために数千または数十億の点から形成してもよい。
【0022】
したがって、より高速な送信、またはストレージの低減を目的として、点群を表すために要するデータ量を削減するために、圧縮技術が必要とされている。ISO/IEC MPEG(JTC 1/SC 29/WG 11)は、静的点群または動的点群のための圧縮技術を標準化するためのアドホックグループ(MPEG-PCC)を創設した。さらに、中国のオーディオビデオ符号化規格ワークグループは、点群の圧縮を標準化するためにアドホックグループ(AVS-PCC)も創設した。
【0023】
図1は、本開示の一実施形態による通信システム(100)の簡略化されたブロック図を示している。通信システム(100)は、例えばネットワーク(150)を介して互いに通信可能な複数の端末デバイスを含む。例えば、通信システム(100)は、ネットワーク(150)を介して相互接続された端末デバイス(110)および(120)の対を含む。
図1の例では、端末デバイス(110)および(120)の第1の対は、点群データの単方向送信を実行することができる。例えば、端末デバイス(110)は、端末デバイス(110)に接続されたセンサ(105)によってキャプチャされた点群(例えば、構造を表す点)を圧縮することができる。圧縮された点群は、例えばビットストリームの形態で、ネットワーク(150)を介して他の端末デバイス(120)に送信され得る。端末デバイス(120)は、ネットワーク(150)から圧縮された点群を受信し、ビットストリームを解凍して点群を再構成し、再構成された点群を適切に表示することができる。単方向データ送信は、メディアサービング用途などで一般的であり得る。
【0024】
図1の例では、端末デバイス(110)および(120)は、サーバ、およびパーソナルコンピュータとして示される場合があるが、本開示の原理はそのように限定されなくてもよい。本開示の実施形態は、ラップトップコンピュータ、タブレットコンピュータ、スマートフォン、ゲーム端末、メディアプレーヤ、および/または専用3次元(3D)機器による用途であることが分かる。ネットワーク(150)は、端末デバイス(110)と端末デバイス(120)との間で圧縮された点群を送信する任意の数のネットワークを表す。ネットワーク(150)は、例えば、有線および/または無線通信ネットワークを含むことができる。ネットワーク(150)は、回線交換および/またはパケット交換チャネルでデータを交換することができる。代表的なネットワークは、電気通信ネットワーク、ローカルエリアネットワーク、ワイドエリアネットワーク、および/またはインターネットを含む。本議論の目的では、ネットワーク(150)のアーキテクチャおよびトポロジーは、以下で説明されない限り、本開示の動作にとって重要ではない場合がある。
【0025】
図2は、一実施形態によるストリーミングシステム(200)の簡略化されたブロック図を示している。
図2の例は、点群の開示された主題の用途である。開示された主題は、3Dテレプレゼンスアプリケーション、仮想現実アプリケーションなどの他の点群対応アプリケーションにも等しく適用可能であり得る。
【0026】
ストリーミングシステム(200)は、キャプチャサブシステム(213)を含むことができる。キャプチャサブシステム(213)は、点群源(201)、例えば光検出と測距(LIDAR)システム、3Dカメラ、3Dスキャナ、例えば非圧縮の点群(202)を生成するソフトウェアの非圧縮の点群を生成するグラフィックス生成コンポーネントなどを含むことができる。一例では、点群(202)は、3Dカメラによってキャプチャされた点を含む。点群(202)は、圧縮された点群(204)(圧縮された点群のビットストリーム)と比較して高いデータ量を強調するために太線として図示されている。圧縮された点群(204)は、点群源(201)に接続されたエンコーダ(203)を含む電子デバイス(220)によって生成され得る。エンコーダ(203)は、以下でより詳細に説明するように、開示された主題の態様を可能にするため、または実装するために、ハードウェア、ソフトウェア、またはそれらの組み合わせを含むことができる。点群(202)のストリームと比較してより低いデータ量を強調するために細い線として図示されている、圧縮された点群(204)(または圧縮された点群(204)のビットストリーム)は、将来の使用のためにストリーミングサーバ(205)に格納され得る。
図2のクライアントサブシステム(206)および(208)などの1つまたは複数のストリーミングクライアントサブシステムは、ストリーミングサーバ(205)にアクセスして、圧縮された点群(204)のコピー(207)および(209)を検索することができる。クライアントサブシステム(206)は、例えば電子デバイス(230)内のデコーダ(210)を含むことができる。デコーダ(210)は、圧縮された点群の入力コピー(207)をデコードし、レンダリングデバイス(212)上にレンダリングすることができる、再構成された点群(211)の出力ストリームを作成する。
【0027】
電子デバイス(220)および(230)が他のコンポーネント(不図示)を含むことができることに留意されたい。例えば、電子デバイス(220)はデコーダ(不図示)を含むことができ、電子デバイス(230)はエンコーダ(不図示)も含むことができる。
【0028】
いくつかのストリーミングシステムでは、圧縮された点群(204)、(207)、および(209)(例えば、圧縮された点群のビットストリーム)を、特定の規格に応じて圧縮することができる。いくつかの例では、点群の圧縮にビデオ符号化規格が使用される。このような規格の例には、高効率ビデオ符号化(HEVC)、またはVersatile Video Coding(VVC)などが含まれる。
【0029】
図3は、いくつかの実施形態による、点群フレームをエンコードするためのV-PCCエンコーダ(300)のブロック図を示している。いくつかの実施形態では、V-PCCエンコーダ(300)は、通信システム(100)およびストリーミングシステム(200)で使用され得る。例えば、エンコーダ(203)は、V-PCCエンコーダ(300)と同様に構成され、動作し得る。
【0030】
V-PCCエンコーダ(300)は、非圧縮入力として点群フレームを受信し、圧縮された点群フレームに対応するビットストリームを生成する。いくつかの実施形態では、V-PCCエンコーダ(300)は、点群源(201)などの点群源から点群フレームを受信してもよい。
【0031】
図3の例では、V-PCCエンコーダ(300)は、パッチ生成モジュール(306)と、パッチパッキングモジュール(308)と、ジオメトリ画像生成モジュール(310)と、テクスチャ画像生成モジュール(312)と、パッチ情報モジュール(304)と、占有マップモジュール(314)と、平滑化モジュール(336)と、画像パディングモジュール(316)および(318)と、グループ拡張モジュール(320)と、ビデオ圧縮モジュール(322)、(323)および(332)と、補助パッチ情報圧縮モジュール(338)と、エントロピー圧縮モジュール(334)と、マルチプレクサ(324)とを含む。
【0032】
本開示の一態様によれば、V-PCCエンコーダ(300)は、圧縮された点群を解凍された点群に変換するために使用されるいくつかのメタデータ(例えば、占有マップおよびパッチ情報)と共に、3D点群フレームを画像ベースの表現に変換する。いくつかの例では、V-PCCエンコーダ(300)は、3D点群フレームをジオメトリ画像、テクスチャ画像および占有マップに変換し、次いでビデオ符号化技術を使用してジオメトリ画像、テクスチャ画像および占有マップをビットストリームにエンコードすることができる。一般に、ジオメトリ画像は、ピクセルに投影された点に関連付けられたジオメトリ値で満たされたピクセルを伴う2D画像であり、ジオメトリ値で満たされたピクセルは、ジオメトリサンプルと呼ぶことができる。テクスチャ画像は、ピクセルに投影された点に関連付けられたテクスチャ値で満たされたピクセルを伴う2D画像であり、テクスチャ値で満たされたピクセルは、テクスチャサンプルと呼ぶことができる。占有マップは、パッチによって占有されているか、または占有されていないかを示す値で満たされたピクセルを有する2D画像である。
【0033】
パッチは、一般に、点群によって説明される表面の連続したサブセットを指してもよい。一例では、パッチは、閾値量未満で互いにずれた表面法線ベクトルを有する点を含む。パッチ生成モジュール(306)は、各パッチが2D空間内の平面に対する深度場によって記述され得るように、点群を、重なり合っていてもいなくてもよいパッチのセットにセグメント化する。いくつかの実施形態では、パッチ生成モジュール(306)は、再構成エラーを最小化しながら、点群を平滑な境界を有する最小数のパッチに分解することを目的とする。
【0034】
パッチ情報モジュール(304)は、パッチのサイズおよび形状を示すパッチ情報を収集することができる。いくつかの例では、パッチ情報を画像フレームにパッキングし、その後補助パッチ情報圧縮モジュール(338)によってエンコードして、圧縮された補助パッチ情報を生成することができる。
【0035】
パッチパッキングモジュール(308)は、抽出されたパッチを2次元(2D)グリッド上にマッピングすると同時に、未使用空間を最小限に抑え、グリッドのすべてのM×M(例えば、16×16)ブロックが固有のパッチと関連付けられることを保証するように構成される。効率的なパッチパッキングは、未使用の空間を最小化する、または時間的一貫性を保証することのいずれかによって、圧縮効率に直接影響を与える可能性がある。
【0036】
ジオメトリ画像生成モジュール(310)は、所与のパッチ位置における点群のジオメトリに関連付けられた2Dジオメトリ画像を生成することができる。テクスチャ画像生成モジュール(312)は、所与のパッチ位置における点群のテクスチャと関連付けられた2Dテクスチャ画像を生成することができる。ジオメトリ画像生成モジュール(310)およびテクスチャ画像生成モジュール(312)は、パッキング処理中に計算された、3Dから2Dへのマッピングを利用して、点群のジオメトリおよびテクスチャを画像として格納する。複数の点が同じサンプルに投影される場合をより良好に処理するために、各パッチは、レイヤと呼ばれる2つの画像に投影される。一例では、ジオメトリ画像は、YUV420-8ビットフォーマットのWxHの単色フレームによって表される。テクスチャ画像を生成するために、テクスチャ生成手順は、再サンプリングされた点に関連付けられる色を計算するために、再構成されたジオメトリ/平滑化されたジオメトリを利用する。
【0037】
占有マップモジュール(314)は、各単位でパディング情報を説明する占有マップを生成することができる。例えば、占有画像は、グリッドの各セルについて、セルが空きスペースに属するか点群に属するかを示すバイナリマップを含む。一例では、占有マップは、ピクセルがパディングされているかどうかをピクセルごとに記述するバイナリ情報を使用する。別の例では、占有マップは、ピクセルのブロックがパディングされているかどうかをピクセルのブロックごとに説明するバイナリ情報を使用する。
【0038】
占有マップモジュール(314)によって生成された占有マップは、可逆符号化または非可逆符号化を使用して圧縮され得る。可逆符号化が使用されるとき、エントロピー圧縮モジュール(334)は、占有マップを圧縮するために使用される。非可逆符号化が使用されるとき、ビデオ圧縮モジュール(332)は、占有マップを圧縮するために使用される。
【0039】
パッチパッキングモジュール(308)は、画像フレーム内にパッキングされた2Dパッチ同士の間にいくつかの空きスペースを残してもよいことに留意されたい。画像パディングモジュール(316)および(318)は、2Dビデオおよび画像コーデックに適し得る画像フレームを生成するために、空きスペースを埋める(パディングと呼ばれる)ことができる。画像パディングは、未使用の空間を冗長な情報で埋めることができる背景充填とも呼ばれる。いくつかの例では、良好な背景充填は、ビットレートを最小限に増加させ、パッチ境界の周りに著しい符号化歪みを導入しない。
【0040】
ビデオ圧縮モジュール(322)、(323)、および(332)は、HEVC、VVCなどの適切なビデオ符号化規格に基づいて、パディングされたジオメトリ画像、パディングされたテクスチャ画像、および占有マップなどの2D画像をエンコードすることができる。一例では、ビデオ圧縮モジュール(322)、(323)、および(332)は、別々に動作する個々のコンポーネントである。別の例では、ビデオ圧縮モジュール(322)、(323)、および(332)を単一のコンポーネントとして実装できることに留意されたい。
【0041】
いくつかの例では、平滑化モジュール(336)は、再構成されたジオメトリ画像の平滑化された画像を生成するように構成される。平滑化された画像は、テクスチャ画像生成(312)に提供され得る。次に、テクスチャ画像生成(312)は、再構成されたジオメトリ画像に基づいてテクスチャ画像の生成を調整し得る。例えば、エンコーディングやデコーディングの際にパッチ形状(例えば、ジオメトリ)に多少の歪みがある場合には、テクスチャ画像を生成するときにその歪みを考慮して、パッチ形状の歪みを補正するようにしてもよい。
【0042】
いくつかの実施形態では、グループ拡張(320)は、符号化利得、ならびに再構成された点群の視覚的品質を改善するために、冗長な低周波数コンテンツでオブジェクト境界の周りにピクセルをパディングするように構成されている。
【0043】
マルチプレクサ(324)は、圧縮されたジオメトリ画像、圧縮されたテクスチャ画像、圧縮された占有マップ、および/または圧縮された補助パッチ情報を圧縮されたビットストリームに多重化することができる。
【0044】
図4は、いくつかの実施形態による、点群フレームに対応する圧縮ビットストリームをデコードするためのV-PCCデコーダ(400)のブロック図を示している。いくつかの実施形態では、V-PCCデコーダ(400)は、通信システム(100)およびストリーミングシステム(200)で使用され得る。例えば、デコーダ(210)は、V-PCCデコーダ(400)と同様に動作するように構成され得る。V-PCCデコーダ(400)は、圧縮されたビットストリームを受信し、圧縮されたビットストリームに基づいて再構成された点群を生成する。
【0045】
図4の例では、V-PCCデコーダ(400)は、デマルチプレクサ(432)と、ビデオ解凍モジュール(434)および(436)と、占有マップ解凍モジュール(438)と、補助パッチ情報解凍モジュール(442)と、ジオメトリ再構成モジュール(444)と、平滑化モジュール(446)と、テクスチャ再構成モジュール(448)と、色平滑化モジュール(452)とを含む。
【0046】
デマルチプレクサ(432)は、圧縮されたビットストリームを受信し、圧縮されたテクスチャ画像、圧縮されたジオメトリ画像、圧縮された占有マップ、および圧縮された補助パッチ情報に分離することができる。
【0047】
ビデオ解凍モジュール(434)および(436)は、適切な規格(例えば、HEVC、VVCなど)により圧縮された画像をデコードし、解凍された画像を出力することができる。例えば、ビデオ解凍モジュール(434)は、圧縮されたテクスチャ画像をデコードし、解凍されたテクスチャ画像を出力し、ビデオ解凍モジュール(436)は、圧縮されたジオメトリ画像をデコードし、解凍されたジオメトリ画像を出力する。
【0048】
占有マップ解凍モジュール(438)は、適切な規格(例えば、HEVC、VVCなど)により圧縮された占有マップをデコードし、解凍された占有マップを出力することができる。
【0049】
補助パッチ情報解凍モジュール(442)は、適切な規格(例えば、HEVC、VVCなど)により圧縮された補助パッチ情報をデコードし、解凍された補助パッチ情報を出力することができる。
【0050】
ジオメトリ再構成モジュール(444)は、解凍されたジオメトリ画像を受信し、解凍された占有マップおよび解凍された補助パッチ情報に基づいて、再構成された点群ジオメトリを生成することができる。
【0051】
平滑化モジュール(446)は、パッチのエッジにおける不一致を平滑化することができる。平滑化手順は、圧縮アーチファクトに起因してパッチ境界で生じる可能性がある潜在的な不連続性を緩和することを目的とする。いくつかの実施形態では、パッチ境界上に位置するピクセルに平滑化フィルタを適用して、圧縮/解凍によって生じる可能性がある歪みを緩和してもよい。
【0052】
テクスチャ再構成モジュール(448)は、解凍されたテクスチャ画像および平滑化ジオメトリに基づいて、点群内の点のテクスチャ情報を決定することができる。
【0053】
色平滑化モジュール(452)は、カラーリングの不一致を平滑化することができる。3D空間内の隣接していないパッチは、2Dビデオ内で互いに隣接してパッキングされることが多い。いくつかの例では、隣接していないパッチからのピクセル値は、ブロックベースのビデオコーデックによって混合される場合がある。色平滑化の目的は、パッチ境界に現れる可視アーチファクトを削減することである。
【0054】
図5は、いくつかの実施形態によるG-PPCエンコーダ(500)のブロック図を示している。エンコーダ(500)は、点群データを受信し、点群データを圧縮して、圧縮された点群データを搬送するビットストリームを生成するように構成され得る。一実施形態では、エンコーダ(500)は、位置量子化モジュール(510)、重複点除去モジュール(512)、8分木エンコーディングモジュール(530)、属性転送モジュール(520)、詳細レベル(LOD)生成モジュール(540)、属性予測モジュール(550)、残差量子化モジュール(560)、算術符号化モジュール(570)、逆残差量子化モジュール(580)、加算モジュール(581)、および再構成された属性値を格納するためのメモリ(590)を含むことができる。
【0055】
示されるように、入力点群(501)はエンコーダ(500)で受信され得る。点群(501)の位置(例えば、3D座標)が量子化モジュール(510)に提供される。量子化モジュール(510)は、座標を量子化して量子化された位置を生成するように構成される。重複点除去モジュール(512)は、量子化された位置を受信し、フィルタ処理を実行して重複点を識別および除去するように構成される。8分木エンコーディングモジュール(530)は、重複点除去モジュール(512)からフィルタリングされた位置を受信し、8分木ベースのエンコーディングプロセスを実行して、ボクセルの3Dグリッドを記述する占有コードのシーケンスを生成するように構成される。占有コードは算術符号化モジュール(570)に提供される。
【0056】
属性転送モジュール(520)は、入力点群の属性を受信し、複数の属性値がそれぞれのボクセルに関連付けられているときに、各ボクセルの属性値を決定するための属性転送プロセスを実行するように構成される。属性転送プロセスは、8分木エンコーディングモジュール(530)から出力された並べ替えられた点に対して実行され得る。転送動作後の属性は、属性予測モジュール(550)に提供される。LOD生成モジュール(540)は、8分木エンコーディングモジュール(530)から出力された並べ替えられた点に対して動作し、点を異なるLODに再編成するように構成される。LOD情報は属性予測モジュール(550)に供給される。
【0057】
属性予測モジュール(550)は、LOD生成モジュール(540)からのLOD情報によって示されるLODベースの順序に従って点を処理する。属性予測モジュール(550)は、メモリ(590)に格納された現在点の隣接点のセットの再構成された属性に基づいて、現在点の属性予測を生成する。続いて、属性転送モジュール(520)から受信した元の属性値およびローカルに生成された属性予測に基づいて予測残差が取得され得る。候補インデックスがそれぞれの属性予測プロセスで使用されるとき、選択された予測候補に対応するインデックスが算術符号化モジュール(570)に提供され得る。
【0058】
残差量子化モジュール(560)は、属性予測モジュール(550)から予測残差を受信し、量子化を実行して量子化された残差を生成するように構成される。量子化された残差は算術符号化モジュール(570)に提供される。
【0059】
逆残差量子化モジュール(580)は、残差量子化モジュール(560)から量子化された残差を受信し、残差量子化モジュール(560)で実行された量子化演算の逆を実行することによって再構成された予測残差を生成するように構成される。加算モジュール(581)は、逆残差量子化モジュール(580)からの再構成された予測残差、および属性予測モジュール(550)からのそれぞれの属性予測を受信するように構成される。再構成された予測残差と属性予測とを組み合わせることによって、再構成された属性値が生成され、メモリ(590)に格納される。
【0060】
算術符号化モジュール(570)は、占有コード、候補インデックス(使用される場合)、量子化された残差(生成される場合)、および他の情報を受信し、受信した値または情報をさらに圧縮するためにエントロピーエンコーディングを実行するように構成される。これにより、圧縮された情報を搬送する圧縮されたビットストリーム(502)が生成され得る。ビットストリーム(502)は、圧縮されたビットストリームをデコードするデコーダに送信されるか、あるいは提供されてもよく、またはストレージデバイスに格納されてもよい。
【0061】
図6は、一実施形態によるG-PCCデコーダ(600)のブロック図を示している。デコーダ(600)は、圧縮されたビットストリームを受信し、点群データ解凍を実行してビットストリームを解凍し、デコードされた点群データを生成するように構成され得る。一実施形態では、デコーダ(600)は、算術デコーディングモジュール(610)、逆残差量子化モジュール(620)、8分木デコーディングモジュール(630)、LOD生成モジュール(640)、属性予測モジュール(650)、および再構成された属性値を格納するためのメモリ(660)を含むことができる。
【0062】
示されるように、圧縮されたビットストリーム(601)は、算術デコーディングモジュール(610)で受信され得る。算術デコーディングモジュール(610)は、圧縮されたビットストリーム(601)をデコードして、量子化された残差(生成される場合)および点群の占有コードを取得するように構成される。8分木デコーディングモジュール(630)は、占有コードにより点群の点の再構成位置を決定するように構成される。LOD生成モジュール(640)は、再構成位置に基づいて点を異なるLODに再編成し、LODベースの順序を決定するように構成される。逆残差量子化モジュール(620)は、算術デコーディングモジュール(610)から受信した量子化された残差に基づいて再構成された残差を生成するように構成される。
【0063】
属性予測モジュール(650)は、LODベースの順序に従って点の属性予測を決定するための属性予測プロセスを実行するように構成される。例えば、現在点の属性予測は、メモリ(660)に格納された現在点の隣接点の再構成された属性値に基づいて決定され得る。いくつかの例では、属性予測をそれぞれの再構成された残差と組み合わせて、現在点の再構成された属性を生成することができる。
【0064】
属性予測モジュール(650)から生成された再構成された属性のシーケンスは、8分木デコーディングモジュール(630)から生成された再構成位置と共に、一例では、デコーダ(600)から出力されるデコードされた点群(602)に対応する。加えて、再構成された属性もメモリ(660)に格納され、その後の点の属性予測を導出するためにその後使用され得る。
【0065】
様々な実施形態において、エンコーダ(300)、デコーダ(400)、エンコーダ(500)、および/またはデコーダ(600)は、ハードウェア、ソフトウェア、またはそれらの組み合わせで実装され得る。例えば、エンコーダ(300)、デコーダ(400)、エンコーダ(500)、および/またはデコーダ(600)は、特定用途向け集積回路(ASIC)、フィールドプログラマブルゲートアレイ(FPGA)などのソフトウェアを用いても、用いなくても動作する1つまたは複数の集積回路(IC)などの処理回路を用いて実装され得る。別の例では、エンコーダ(300)、デコーダ(400)、エンコーダ(500)、および/またはデコーダ(600)は、不揮発性(または非一時的)コンピュータ可読記憶媒体に格納された命令を含むソフトウェアまたはファームウェアとして実装され得る。命令は、1つまたは複数のプロセッサなどの処理回路によって実行されると、処理回路に、エンコーダ(300)、デコーダ(400)、エンコーダ(500)、および/またはデコーダ(600)の機能を実行させる。
【0066】
本明細書で開示された属性予測技術を実装するように構成された属性予測モジュール(550)および(650)は、
図5および
図6に示されたものと同様のまたは異なる構造を有し得る他のデコーダまたはエンコーダに含まれ得ることに留意されたい。加えて、エンコーダ(500)およびデコーダ(600)は、同じデバイス、または様々な例では別個のデバイスに含まれ得る。
【0067】
テストモデル13(TMC13)では、ジオメトリ情報と、色または反射率などの点群の関連する属性とを別々に圧縮することができる。点群の3D座標であるジオメトリ情報は、点群の占有情報を有する8分木分割によって符号化され得る。次いで、属性は、予測、リフティング、および領域適応型階層変換(RAHT)技術を使用して、再構成されたジオメトリに基づいて圧縮され得る。
【0068】
点群の予測ベースの属性符号化を、以下のように説明することができる。簡単にするために、予測ベースの属性符号化では、1つの詳細レベル(LoD)を仮定することができる。
【0069】
点群の点に対応する位置のセットを(P
i)
i=1...Nとし、(P
i)
i=1...Nに対応するMortonコードを(M
i)
i=1...Nとする。最初に、点は、関連する点のMortonコードに従って昇順でソートすることができる。Iを昇順に並べられた点インデックスの配列とする。エンコーダ/デコーダは、Iによって定義された順序に従って点をそれぞれ圧縮/解凍することができる。各反復iにおいて、点P
iを選択することができる。P
iからs(例えば、s=64)個の前の点までの距離を分析することができ、P
iのk(例えば、k=3)個の最近傍を選択して予測に使用することができる。より正確には、属性値
【数7】
は、点iの最近傍の距離に基づく線形補間プロセスを使用することによって予測され得る。
【数8】
を現在点iのk個の最近傍のセットとし、
【数9】
をk個の最近傍のセットのデコード/再構成された属性値とし、
【数10】
を現在点iに対するk個の最近傍のセットの距離とする。予測属性値
【数11】
を、次の式(1)に従って、近傍の属性値および現在点までの近傍のセットの距離に基づいて計算することができる。
【数12】
【0070】
AVS-PCCにおける予測ベースの属性符号化は、MPEGにおける予測ベースの属性符号化とは異なり得る。1つの違いは、ソート順序である。AVS-PCCにおける予測ベースの属性符号化には、Hilbertソート順序を使用することができる。AVS-PCCにおける予測ベースの属性符号化の符号化プロセスを、以下のように示すことができる。まず、ルックアップテーブルを使用して点群内の点のHilbert符号を決定することができる。次に、点群内のすべての点を、点のHilbert符号値を使用してソートすることができる。より小さいHilbert符号を有する点は、より大きいHilbert符号を有する点の前に現れることができる。
【0071】
リフティングベースの属性符号化を、予測ベースの属性符号化に基づいて構築することができる。予測ベースの属性符号化と比較して、リフティングベースの属性符号化には2つの追加ステップ、すなわち(a)更新オペレータの導入、および(b)適応量子化戦略の使用、が導入される。
【0072】
説明のために、リフティングベースの属性符号化の動作を
図7および
図8に示すことができる。
図7は、リフティングベースの属性符号化における順変換700のブロック図を示し、
図8は、リフティングベースの属性符号化における逆変換800のブロック図を示す。
【0073】
図7に示すように、レベルNの属性信号は、ハイパス信号H(N)とローパス信号L(N)に分離され得る。L(N)は、予測プロセス702に基づいて予測信号P(N)を生成することができる。差分信号D(N)は、H(N)とL(N)との差分に基づいて生成され得る。差分信号D(N)をさらに更新して、更新信号U(N)を生成することができる。U(N)とL(N)との和は、更新後のローパス信号L’(N)を生成することができる。L’(N)は、さらに、後段のレベル(N-1)において、ハイパス信号H(N-1)とローパス信号L(N-1)に分離され得る。L(N-1)は、レベルN-1の予測信号P(N-1)を生成することができる。H(N-1)とL(N-1)との差分に基づいて、レベルN-1の差分信号D(N-1)を生成することができる。差分信号D(N-1)をさらに更新して、レベルN-1の更新信号U(N-1)を生成することができる。U(N-1)とL(N-1)との和は、レベルN-1で更新後のローパス信号L’(N-1)を生成することができる。
【0074】
差分信号D(N-1)と更新後のローパス信号L’(N-1)を、D(N-2)とL’(N-2)にさらに分解することができる。分割ステップは、ベースレイヤの更新後のローパス信号L’(0)が得られるまで繰り返し適用され得る。
【0075】
図8では、リフティングベースの属性符号化の逆変換800が提供されている。
図8に示すように、更新後のローパス信号L’(0)と更新後の信号U(0)との差分に基づいて、レベル0のローパス信号L(0)を生成することができる。更新後の信号U(0)は、差分信号D(0)を更新することで得られる。L(0)は、予測プロセス802に基づいて予測信号P(0)をさらに生成することができる。さらに、P(0)にD(0)を加算して、ハイパス信号H(0)を生成する。H(0)およびL(0)をマージして、レベル1の更新後のローパスL’(1)を生成することができる。マージステップは、ハイパス信号H(N)およびローパス信号L(N)がレベルNで生成されるまで繰り返し適用され得る。H(N)およびL(N)をさらにマージして再構成された属性信号を形成することができる。
【0076】
図9Aは、RAHTベースの属性符号化のための順変換900Aを示し、
図9Bは、RAHTベースの属性符号化のための逆変換900Bを示している。
図9Aおよび
図9Bにおいて、
【数13】
および
【数14】
であり、w
0は入力係数F
l+1,2nの重みの表記であり、w
1は入力係数F
l+1,2n+1の重みの表記である。
【0077】
Haarベースの属性符号化をAVS-PCCに導入することもできる。Haarベースの属性符号化の技術は、以下のように記述され得る。Haarベースの属性符号化は、Haar変換に基づいて点群の点に対して点群圧縮を実行するように構成され得る。
【0078】
Haarベースの属性符号化の第1のステップでは、点群内の点を、属性符号化の前にMorton順序を使用してソートすることができ、より小さいMortonコードを有する点は、より大きいMortonコードを有する点の前に現れることができる。点群におけるk番目の点の座標は、(X
k,Y
k,Z
k),k=0,...,N-1と表すことができ、ここで、X
k、Y
K、およびZ
kは、式(2)~式(4)において3つのLビット数として表すことができる。
【数15】
【0079】
k番目の点のMortonコードは、3Lビット数として表すことができ、これを以下の式(5)に示すことができる。
【数16】
Morton順序の点の対応する属性は、A
k,k=0,1,...,N-1と表すことができる。
【0080】
Haarベースの属性符号化の第2のステップでは、以下のように、式(6)のMorton順序で連続する点の対の属性にHaar変換を適用することができる。
【数17】
ここで、
【数18】
は、x>0に対してx以下の最大整数を表し、Haar変換行列Tは、式(7)において以下のように表すことができる。
【数19】
ここで、
【数20】
はHaar変換係数である。
【数21】
はスケーリング係数である。
Nが奇数である場合、最後の点A
N-1は対になる点を有さない。最後の点A
N-1の対応するHaar変換係数は、式(8)において以下のように表すことができる。
【数22】
【0081】
高周波成分、
【数23】
のH
2n+1は、最終的なHaar変換係数の一部を形成するようにグループ化され得る。低周波成分、Nが奇数である場合の
【数24】
のH
2nおよびH
N-1については、1つの成分のみが残るまで、連続する成分の対に別のラウンドのHaar変換を適用することができる。さらに、すべての高周波成分および最後の成分をグループ化して最終的なHaar変換係数を形成することができ、これはn=0,1,...,N-1に対して
【数25】
として表すことができる。
【0082】
Haarベースの属性符号化の第3のステップでは、変換係数を量子化することができ、量子化変換係数をさらに符号化することができる。
【0083】
Haarベースの属性符号化の第4のステップでは、逆Haar変換を量子化変換係数に適用して、再構成された属性を取得することができる。残差は、元の属性から再構成された属性を減算することによって計算され得る。
【0084】
Haarベースの属性符号化の最後のステップでは、属性残差を量子化することができ、量子化された属性残差をさらに符号化することができる。
【0085】
属性残差の量子化ステップをQ
setとすると、変換係数の量子化ステップサイズQ
transは、式(9)で以下のように与えることができることに留意されたい。
【数26】
【0086】
また、属性残差と量子化変換係数の符号化方法は同じであってもよい。例えば、値xが与えられると、符号化方法は、以下のようにステップ(a)~(e)で説明することができる:
(a)xが0に等しいか否かを示すフラグを符号化する(xが0に等しい場合、フラグ=1であり、xが0に等しくない場合、フラグ=0である);
(b)xが0に等しくない場合、xのサインを符号化する(xが0以下である場合、サイン=0であり、xが0より大きい場合、サイン=1である);
(c)xの絶対値が1に等しいか否かを示すフラグを符号化する(|x|が1に等しい場合、フラグ=1であり、|x|>1の場合、フラグ=0であり、|x|はxの絶対値を示す);
(d)|x|>1の場合、xの絶対値が2に等しいか否かを示すフラグを符号化する(|x|が2に等しい場合、フラグ=1であり、|x|>2の場合、フラグ=0である);および
(e)|x|>2の場合、0次指数ゴロム符号を使用して|x|-3を符号化する。
【0087】
AVS-PCCで採用されているHaarベースの属性符号化には、いくつかの問題があり得る。例えば、Haarベースの属性符号化では、点群全体の属性を使用して、Haar変換の複数のレイヤを構成する。N個の点を有する点群の場合、すべての最終変換係数を得るためにハール変換の
【数27】
レイヤを適用しなければならず、
【数28】
はlog
2(N)以上の最小整数である。したがって、Nが大きい場合、大きなレイテンシをもたらすことができる。さらに、点のソート、量子化方式、量子化変換係数の符号化、および量子化された属性残差も改善することができる。
【0088】
本開示は、Haarベースの属性符号化を改善するための方法を含む。
【0089】
点のソートを改善するために、一実施形態では、Morton順序ソート(MortonソートまたはMorton順序とも呼ばれる)の代わりに、Hilbertソート(またはHilbert順序)などの異なるソート順序を使用して、Haarベースの属性符号化の前に点群の点をソートすることができる。Hilbert順序でソートされた点は、隣接する点とのより高い相関を有することが多いため、属性符号化性能の利得を達成することができる。
【0090】
一実施形態では、どのソート方法がHaarベースの属性符号化で使用されるかを示すために、sort_methodなどのソート方法フラグを使用することができる。ソート方法フラグを、シーケンスパラメータセット(SPS)、属性パラメータセット(APS)、スライスヘッダなどの高レベルシンタックスで搬送することができる。一例として、ソート方法フラグを、表1に示すことができるAPSで搬送することができる。
【0091】
【0092】
表1に示すように、ソート方法フラグ(例えば、aps_sort_method)は、Haarベースの属性符号化前のソート方法を指定することができる。ソート方法フラグ(例えば、aps_sort_method)が第1の値(例えば、0)と等しいとき、Mortonソートが使用されることが示される。ソート方法フラグ(例えば、aps_sort_method)が第2の値(例えば、1)と等しいとき、Hilbertソートなどの別のソート方法が使用されることが示される。なお、一般的には、昇順のソート順が用いられる。しかしながら、降順のソートも使用することができる。さらに、ソート方法は、Morton順序およびHilbert順序に限定されず、他の実施形態では、1つまたは複数の異なるソート方法が利用されてもよい。別の実施形態では、Hilbertソート順序が常に使用され、属性パラメータセットにaps_sort_methodフラグを追加する必要はない。
【0093】
一実施形態では、属性残差の量子化パラメータに基づいて変換係数の量子化パラメータを決定する代わりに、量子化パラメータを、SPS、APS、スライスヘッダなどの高レベルシンタックスで指定することができる。したがって、変換係数の異なる量子化パラメータを、点群の異なる用途(例えば、文化財のオブジェクトのオブジェクト検出および位置特定、マッピング、ならびに視覚化およびアーカイブ)または異なる特性(例えば、ジオメトリ情報、色、および反射率)に基づいて設定することができる。一例として、量子化パラメータをAPSで搬送することができ、これを表2に示すことができる。
【0094】
【0095】
表2に示すように、量子化パラメータフラグ(例えば、aps_tran_coeff_qp)は、変換係数を量子化するために使用される量子化パラメータを指定することができる。エンコーダ側では、量子化パラメータを、属性残差の量子化パラメータに基づいて、または他の基準、例えば、アプリケーション(例えば、オブジェクトの検出および位置特定、マッピング、ならびに/または文化財オブジェクトの視覚化およびアーカイブ)または点群の特性(例えば、ジオメトリ情報、色、および/または反射率)などに基づいて設定することができる。さらに、決定された量子化パラメータを、量子化パラメータフラグ(例えば、aps_tran_coeff_qp)を介してデコーダ側にシグナリングすることができる。別の実施形態では、ビットストリーム内でaps_trans_coeff_qpを直接送信する代わりに、aps_trans_qp_deltaとして示される属性残差を符号化するために使用されるaps_trans_coeff_qpとqpとの間の差をビットストリーム内で搬送することができる。
【0096】
量子化変換係数の特性は、生の(量子化されていない)変換係数の特性に依存するだけでなく、量子化パラメータにも依存し得ることが観察される。量子化パラメータが大きい場合、量子化変換係数はゼロ値付近により集中する可能性があり、量子化変換係数の範囲は小さくなり得る。しかしながら、量子化パラメータが小さいほど、量子化変換係数は、より広い範囲に広がる傾向がある。したがって、量子化パラメータが異なる場合、異なる符号化方法を利用することができる。
【0097】
本出願では、量子化変換係数をエントロピー符号化するために指数ゴロム符号を適用することができる。一実施形態では、指数ゴロム符号の順序は、変換係数の量子化パラメータと共に、SPS、APS、スライスヘッダなどの高レベルシンタックスで指定され得る。一例として、指数ゴロム符号の順序は、表3に示すことができるAPSで指定され得る。
【0098】
【0099】
表3において、上述したように、量子化パラメータフラグaps_tran_coeff_qpは、変換係数の量子化に用いられる量子化パラメータを指定することができる。符号化フラグ(例えば、aps_trans_coeff_eg_order)は、量子化変換係数の絶対値から閾値を引いた値を符号化する際の指数ゴロム符号の次数を指定することができる。閾値は、量子化変換符号化スキーム全体に応じて、2または1もしくは3などの他の値とすることができる。
【0100】
指数ゴロム符号の次数kが符号化フラグ(例えば、aps_trans_coeff_eg_order)によって決定されると、k次指数ゴロム符号を使用して非負整数xを符号化するエントロピー符号化プロセスは、以下のように実行され得る:(a)最初に、0次指数ゴロム符号を使用して
【数29】
をエンコードし、次いで、(b)バイナリ形式で(x modulo 2
k)をエンコードし、xは量子化変換係数とすることができる。
【0101】
別の実施形態では、指数ゴロム符号の次数kは、より小さい量子化パラメータが比較的大きい次数を必要とするという原理によって、変換係数の量子化パラメータに基づいて暗黙的に決定され得る。一実施形態では、次数kを、以下のように式(10)で指定することができる。
【数30】
ここで、max_kは、量子化変換係数の符号化に使用される指数ゴロム符号の最大次数であり、trans_coeff_qpは、変換係数の量子化に使用される量子化パラメータの値であり、sは正のスカラであり、しばしば6または8などに設定される。いくつかの実施形態では、量子化パラメータの値が0に等しい場合、可逆符号化を示すことができる。量子化パラメータの値を大きくすると、それに応じて量子化ステップも大きくなる。いくつかの実施形態では、値max_kを2または3に設定することができる。
【0102】
上述したように、AVS-PCCでは、N個の点を有する点群に対して、すべての最終変換係数を取得するためにHaar変換(またはHaarベースの変換)の
【数31】
レイヤを適用する必要があり、これはNが大きい場合に大きな待ち時間を引き起こす可能性がある。
【0103】
一実施形態では、N個の点を有する点群を最初に選択的にソートすることができる。例えば、点群は、前述のようにMorton順序またはHilbert順序のいずれかを使用して選択的にソートされ得る。ソート順序は、Morton順序およびHilbert順序に限定されず、他の実施形態では、1つまたは複数の異なるソート順序が利用されてもよい。ソートされたN個の点を、複数のセグメントにさらに分割することができる。複数のセグメントの各々は、最後のセグメントがM個未満の点を含み得ることを除いて、M個の点を含むことができる。セグメントの数は、
【数32】
として表すことができる。分割は、例えば、
図10に示すことができる。
【0104】
セグメントごとに、マルチレイヤHaar変換を適用することができる。複数のセグメントは互いに依存しないので、複数のセグメントを並列にエンコード/デコードすることができる。並列エンコーディング/デコーディングは、エンコーディング/デコーディング遅延を低減するのを助けることができる。さらに、各セグメントがシリアル方式でエンコード/デコードされる場合、メモリ要件を大幅に低減することができる。
【0105】
AVS-PCCでは、式(7)に示されている変換行列T内のスケーリング係数
【数33】
または
【数34】
に起因して、Haarベースの順変換とHaarベースの逆変換との両方で固定点演算が利用される。
【0106】
一実施形態では、Haarベースの順変換およびHaarベースの逆変換は同じであり得、これを式(1)に示すことができる。別の実施形態では、Haarベースの順変換の変換行列におけるスケーリング係数は1とすることができ、これを式(11)に示すことができる。Haarベースの逆変換の変換行列におけるスケーリング係数は1/2とすることができ、これを式(12)に示すことができる。
【数35】
【0107】
Nが奇数である場合、最後の点AN-1は対になる点を有さない。最後の点AN-1の対応する変換係数は、式(13)において以下のように表すことができる。
HN-1=2×AN-1 式(13)
したがって、Haarベースの逆変換の間、Nが奇数である場合、変換係数は最後の点について2で除算することができる。したがって、整数演算のみが必要である。変換および逆変換の複雑さを低減することができる。
【0108】
本開示は、TMC13ソフトウェア、MPEG-PCC、またはAVS-PCC規格に限定されないことに留意されたい。本開示は、ほとんどのPCCシステムのための一般的な解決策を提供する。さらに、本開示の方法および実施形態は、別々に使用されてもよいし、任意の順序で組み合わされてもよい。さらに、各方法(または実施形態)は、処理回路(例えば、1つもしくは複数のプロセッサまたは1つもしくは複数の集積回路)によって実施されてよい。一例では、1つまたは複数のプロセッサは、非一時的コンピュータ可読媒体に格納されたプログラムを実行することができる。
【0109】
図11は、本開示の実施形態によるプロセス(1100)の概要を示すフローチャートを示している。プロセス(1100)を、点群のデコーディングプロセス中に使用され得る。様々な実施形態では、プロセス(1100)は、端末デバイス(110)の処理回路、エンコーダ(203)および/またはデコーダ(2
10)の機能を実行する処理回路、エンコーダ(300)、デコーダ(400)、エンコーダ(500)、および/またはデコーダ(600)の機能を実行する処理回路などの処理回路によって実行され得る。いくつかの実施形態では、プロセス(1100)はソフトウェア命令で実施され得、したがって、処理回路がソフトウェア命令を実行するとき、処理回路はプロセス(1100)を実行する。
【0110】
図11に示すように、プロセス(1100)は(S1101)から開始し、(S1110)に進む。
【0111】
(S1110)では、点群の符号化ビットストリーム内の第1のシグナリング情報に基づいて、点群の点のセットのソート方法を決定することができる。
【0112】
(S1120)では、点群のHaarベースの属性符号化の変換係数を量子化するための量子化パラメータは、点群の符号化ビットストリーム内の第2のシグナリング情報に基づいて決定され得る。
【0113】
(S1130)では、量子化変換係数をデコードするためのエントロピーデコーディング方法は、第2のシグナリング情報に基づいて決定された量子化パラメータに従って決定され得る。
【0114】
(S1140)では、量子化変換係数は、エントロピーデコーディング方法に基づいてさらに決定され得る。
【0115】
(S1150)では、点群の属性は、決定されたソート方法および決定された量子化変換係数に基づいて再構成され得る。
【0116】
一例では、ソート方法は、第1の値に等しい第1のシグナリング情報に基づいてMortonソートであると判定され得る。別の例では、ソート方法は、第2の値に等しい第1のシグナリング情報に基づいてHilbertソートであると判定され得る。
【0117】
いくつかの実施形態では、第2のシグナリング情報は、量子化パラメータ、点群の用途、および点群の特性のうちの1つに基づいて設定され得る。
【0118】
プロセス(1100)では、エントロピーデコーディング方法が指数ゴロム符号化である場合、指数ゴロム符号化の次数kを、符号化ビットストリーム内の第3のシグナリング情報に基づいて決定することができ、第3のシグナリング情報は指数ゴロム符号化の次数kを示す。
【0119】
プロセス(1100)では、エントロピーデコーディング方法が指数ゴロム符号化である場合、量子化パラメータに基づいて指数ゴロム符号化の次数kを決定することができる。したがって、次数は
【数36】
である。max_kは、量子化変換係数をデコードするための指数ゴロム符号化の最大次数であり、trans_coeff_qpは、量子化パラメータの値であり、sは、6および8のいずれかに等しい正の整数である。
【0120】
いくつかの実施形態では、エントロピーデコーディング方法に基づいて量子化変換係数を決定するために、指数ゴロム符号化および指数ゴロム符号化の決定された次数kに基づいて、閾値を減算した量子化変換係数の絶対値をデコードすることができる。閾値は、1、2、および3のうちの1つに等しくすることができる。
【0121】
いくつかの実施形態では、エントロピーデコーディング方法に基づいて量子化変換係数を決定するために、量子化変換係数の第1の量子化変換係数xをデコードすることができる。第1の量子化変換係数xを指数ゴロム符号化によって符号化することができ、その結果、第1の部分
【数37】
は、次数kが0に等しい指数ゴロム符号化を使用して符号化され、第2の部分(x modulo 2
k)がバイナリ形式で符号化される。
【0122】
プロセス(1100)では、決定されたソート方法に基づいて、点群の点のセットをソートすることができる。符号化ビットストリーム内のシグナリング情報の分割によって示される分割サイズに基づいて、点群のソートされた点のセットを複数のセグメントにさらに分割することができる。点群の複数のセグメントの各々は、決定された量子化変換係数に基づいて再構成され得る。
【0123】
いくつかの実施形態では、複数のセグメントの数は
【数38】
に等しくすることができ、Nは点群内の点のセットの数とすることができ、Mは正の整数とすることができる。
【0124】
プロセス(1100)では、点群を再構成するために、Haarベースの属性符号化に関連するHaar変換行列の1/2のスケーリング係数を決定することができる。Haarベースの属性符号化に基づいて変換係数を取得するために、量子化変換係数に対して逆量子化演算を実行することができる。Haar変換行列および変換係数に基づいて点群に対して逆変換演算を実行して、属性残差を取得することができる。Haarベースの属性符号化によって得られた点群の属性残差および予測属性に基づいて、点群の属性をさらに再構成することができる。
【0125】
上記のとおり、上述した技術は、コンピュータ可読命令を使用し、1つまたは複数のコンピュータ可読媒体に物理的に格納されたコンピュータソフトウェアとして実装され得る。例えば、
図12は、開示されている主題の特定の実施形態を実施するのに適したコンピュータシステム(1800)を示している。
【0126】
コンピュータソフトウェアは、1つまたは複数のコンピュータ中央処理装置(CPU:central processing unit)およびグラフィックス処理装置(GPU:Graphics Processing Unit)などによって直接的に、または解釈およびマイクロコードの実行などを通して実行され得る命令を含むコードを作成するために、アセンブリ、コンパイル、リンキング、または同様のメカニズムを受け得る任意の適切な機械コードまたはコンピュータ言語を使用して符号化され得る。
【0127】
命令は、例えばパーソナルコンピュータ、タブレットコンピュータ、サーバ、スマートフォン、ゲーミングデバイス、およびモノのインターネットデバイスなどを含む様々なタイプのコンピュータまたはそのコンポーネント上で実行され得る。
【0128】
コンピュータシステム(1800)に関して
図12に示されているコンポーネントは、本質的に例示であり、本開示の実施形態を実施するコンピュータソフトウェアの使用または機能の範囲に関する限定を示唆することを意図されていない。また、コンポーネントの構成は、コンピュータシステム(1800)の例示的実施形態に示されるコンポーネントのいずれか1つまたは組み合わせに関連する依存性または要件を有すると解釈されるべきではない。
【0129】
コンピュータシステム(1800)は、特定のヒューマンインタフェース入力デバイスを含み得る。そのようなヒューマンインタフェース入力デバイスは、例えば、触覚入力(キーストローク、スワイプ、データグローブの動きなど)、音声入力(音声、拍手など)、視覚入力(ジェスチャなど)、嗅覚入力(図示せず)を介して、1人または複数の人間のユーザによる入力に応答し得る。ヒューマンインタフェースデバイスは、オーディオ(スピーチ、音楽、周囲音など)、画像(スキャンされた画像、静止画カメラから得られた写真画像など)、ビデオ(2次元ビデオ、立体ビデオを含む3次元ビデオなど)など、人間による意識的な入力に必ずしも直接関係しないある特定の媒体をキャプチャするためにも使用され得る。
【0130】
入力ヒューマンインタフェースデバイスは、キーボード(1801)、マウス(1802)、トラックパッド(1803)、タッチスクリーン(1810)、データグローブ(図示せず)、ジョイスティック(1805)、マイク(1806)、スキャナ(1807)、カメラ(1808)のうちの1つまたは複数(それぞれ1つずつ図示されている)を含み得る。
【0131】
コンピュータシステム(1800)はまた、特定のヒューマンインタフェース出力デバイスを含み得る。そのようなヒューマンインタフェース出力デバイスは、例えば、触覚出力、音、光、および嗅覚/味覚を通して、1人または複数の人間のユーザの感覚を刺激し得る。このようなヒューマンインタフェース出力デバイスは、触覚出力デバイス(例えば、タッチスクリーン(1810)、データグローブ(図示せず)、またはジョイスティック(1805)による触覚フィードバックであるが、入力デバイスとして機能しない触覚フィードバックデバイスもあり得る)、オーディオ出力デバイス(スピーカ(1809)、ヘッドフォン(図示せず)など)、視覚出力デバイス(CRTスクリーン、LCDスクリーン、プラズマスクリーン、OLEDスクリーン(それぞれタッチスクリーン入力機能の有無にかかわらない、それぞれ触覚フィードバック機能の有無にかかわらない、これらの一部は、2次元視覚出力、またはステレオグラフィック出力などの手段による3次元を超える出力を出力することができ得る)を含むスクリーン(1810)、仮想現実眼鏡(図示せず)、ホログラフィックディスプレイ、およびスモークタンク(図示せず)など)、ならびにプリンタ(図示せず)を含み得る。
【0132】
コンピュータシステム(1800)はまた、人間がアクセス可能な記憶装置およびそれらの関連媒体、例えば、CD/DVDなどの媒体を有するCD/DVD ROM/RW(1820)を含む光学媒体(1821)、サムドライブ(1822)、リムーバブルハードドライブまたはソリッドステートドライブ(1823)、テープおよびフロッピーディスク(図示せず)などのレガシー磁気媒体、セキュリティドングル(図示せず)などの専用ROM/ASIC/PLDベースのデバイスなどを含むことができる。
【0133】
当業者はまた、本開示の主題に関連して使用される「コンピュータ可読媒体」という用語が伝送媒体、搬送波、または他の一時的信号を包含しないことを理解すべきである。
【0134】
コンピュータシステム(1800)は、1つまたは複数の通信ネットワークへのインタフェースも含むことができる。ネットワークは、例えば、無線、有線、光とすることができる。ネットワークはさらに、ローカル、広域、メトロポリタン、車両および産業、リアルタイム、遅延耐性などであり得る。ネットワークの例には、イーサネット、無線LANなどのローカルエリアネットワーク、GSM、3G、4G、5G、LTEなどを含むセルラーネットワーク、ケーブルテレビ、衛星テレビ、および地上波放送テレビを含むテレビ有線または無線広域デジタルネットワーク、CANBusを含む車両および産業用などが含まれる。特定のネットワークは、一般的には、特定の汎用データポートまたは周辺バス(1849)(例えば、コンピュータシステム(1800)のUSBポートなど)に接続される外部ネットワークインタフェースアダプタを必要とし、他のものは、一般的には、以下で説明されるようにシステムバスへの接続によってコンピュータシステム(1800)のコアに統合される(例えば、PCコンピュータシステムへのイーサネットインタフェースまたはスマートフォンコンピュータシステムへのセルラーネットワークインタフェース)。これらのネットワークのいずれかを使用して、コンピュータシステム(1800)は他のエンティティと通信できる。このような通信は、一方向、受信のみ(例えば、テレビ放送)、一方向の送信のみ(例えば、特定のCANbusデバイスへのCANbus)、または双方向、例えば、ローカルまたはワイドエリアデジタルネットワークを使用する他のコンピュータシステムへの通信である。ある特定のプロトコルおよびプロトコルスタックが、上記のような、これらのネットワークとネットワークインタフェースとのそれぞれで使用され得る。
【0135】
前述のヒューマンインタフェースデバイス、ヒューマンアクセス可能な記憶装置、およびネットワークインタフェースは、コンピュータシステム(1800)のコア(1840)に接続され得る。
【0136】
コア(1840)は、1つまたは複数の中央処理装置(CPU)(1841)、グラフィックス処理装置(GPU)(1842)、フィールドプログラマブルゲートエリア(FPGA)(1843)の形式の特殊なプログラム可能な処理装置、特定のタスク用のハードウェアアクセラレータ(1844)などを含むことができる。これらのデバイスは、読み取り専用メモリ(ROM)(1845)、ランダムアクセスメモリ(1846)、ユーザがアクセスできない内蔵ハードドライブなどの内部大容量記憶装置、SSDなど(1847)と共にシステムバス(1848)を介して接続され得る。一部のコンピュータシステムでは、追加のCPU、GPUなどによる拡張を可能にするために、1つまたは複数の物理プラグの形式でシステムバス(1848)にアクセスすることができる。周辺デバイスは、コアのシステムバス(1848)に直接接続され得るか、または周辺バス(1849)を介して接続され得る。周辺バスのアーキテクチャは、PCIおよびUSBなどを含む。
【0137】
CPU(1841)、GPU(1842)、FPGA(1843)、およびアクセラレータ(1844)は、組み合わせて前述のコンピュータコードを構成できる特定の命令を実行できる。そのコンピュータコードを、ROM(1845)またはRAM(1846)に格納することができる。また、移行データをRAM(1846)に格納することができ、一方、永続データを、例えば内部大容量記憶装置(1847)に格納することができる。任意のメモリデバイスの高速格納および検索は、1つまたは複数のCPU(1841)、GPU(1842)、大容量記憶装置(1847)、ROM(1845)、RAM(1846)などに密接に関連付けられ得るキャッシュメモリの使用を通じて可能にすることができる。
【0138】
コンピュータ可読媒体は、様々なコンピュータ実装動作を実行するためのコンピュータコードを有することができる。媒体およびコンピュータコードは、本開示の目的のために特別に設計され構成されたものにすることができ、あるいはコンピュータソフトウェアの技術分野の当業者によく知られ、当業者が使用可能な種類のものであってもよい。
【0139】
限定ではなく、例として、アーキテクチャ(1800)、特にコア(1840)を有するコンピュータシステムは、1つまたは複数の有形のコンピュータ可読媒体で具現化されたソフトウェアを実行するプロセッサ(CPU、GPU、FPGA、アクセラレータなどを含む)の結果として機能を提供することができる。このようなコンピュータ可読媒体は、上記で紹介したユーザアクセス可能な大容量記憶装置、ならびにコア内部大容量記憶装置(1847)やROM(1845)などの非一時的な性質のコア(1840)の特定の記憶装置に関連付けられた媒体であり得る。本開示の様々な実施形態を実施するソフトウェアは、そのようなデバイスに格納され、コア(1840)によって実行され得る。コンピュータ可読媒体は、特定の必要性に応じて、1つまたは複数のメモリデバイスまたはチップを含むことができる。ソフトウェアは、コア(1840)に、具体的にはその中のプロセッサ(CPU、GPU、およびFPGAなどを含む)に、RAM(1846)に記憶されたデータ構造を定義すること、およびソフトウェアによって定義されたプロセスに従ってこのようなデータ構造を変更することを含む、本明細書で説明されている特定のプロセスまたは特定のプロセスの特定の部分を実行させることができる。加えて、または代替として、コンピュータシステムは、本明細書で説明されている特定のプロセスまたは特定のプロセスの特定の部分を実行するために、ソフトウェアの代わりにまたはソフトウェアと共に動作し得る、回路にハードワイヤードされた、または他の方法で具現化された論理(例えば、アクセラレータ(1844))の結果として機能を提供することができる。ソフトウェアへの言及は、適切な場合には、ロジックを包含することができ、逆もまた同様である。コンピュータ可読媒体への言及は、適切な場合は、実行のためのソフトウェアを記憶する回路(集積回路(IC)など)、実行のためのロジックを具現化する回路、またはその両方を包含することができる。本開示は、ハードウェアとソフトウェアとの任意の適切な組み合わせを包含する。
【0140】
本開示はいくつかの例示的な実施形態を説明してきたが、本開示の範囲内にある修正例、置換例、および様々な代替均等例がある。したがって、当業者は、本明細書では明示的に示されていないか、または記載されていないが、本開示の原理を具現化し、したがってその趣旨および範囲内にある多数のシステムおよび方法を考案できることが理解されよう。
【符号の説明】
【0141】
100 通信システム
105 センサ
110 端末デバイス
120 端末デバイス
200 ストリーミングシステム
201 点群源
202 点群
203 エンコーダ
204 点群
205 ストリーミングサーバ
206 クライアントサブシステム
207 点群の入力コピー
208 クライアントサブシステム
209 点群
210 デコーダ
211 再構成された点群
212 レンダリングデバイス
213 キャプチャサブシステム
220 電子デバイス
230 電子デバイス
300 V-PCCエンコーダ
304 パッチ情報モジュール
306 パッチ生成モジュール
308 パッチパッキングモジュール
310 ジオメトリ画像生成モジュール
312 テクスチャ画像生成モジュール
314 占有マップモジュール
316 画像パディングモジュール
318 画像パディングモジュール
320 グループ拡張モジュール
322 ビデオ圧縮モジュール
323 ビデオ圧縮モジュール
324 マルチプレクサ
332 ビデオ圧縮モジュール
334 エントロピー圧縮モジュール
336 平滑化モジュール
338 補助パッチ情報圧縮モジュール
400 V-PCCデコーダ
432 デマルチプレクサ
434 ビデオ解凍モジュール
436 ビデオ解凍モジュール
438 占有マップ解凍モジュール
442 補助パッチ情報解凍モジュール
444 ジオメトリ再構成モジュール
446 平滑化モジュール
448 テクスチャ再構成モジュール
452 色平滑化モジュール
500 G-PPCエンコーダ
501 入力点群
502 圧縮されたビットストリーム
510 量子化モジュール
512 重複点除去モジュール
520 属性転送モジュール
530 8分木エンコーディングモジュール
540 詳細レベル(LOD)生成モジュール
550 属性予測モジュール
560 残差量子化モジュール
570 算術符号化モジュール
580 逆残差量子化モジュール
581 加算モジュール
590 メモリ
600 G-PCCデコーダ
601 圧縮されたビットストリーム
602 デコードされた点群
610 算術デコーディングモジュール
620 逆残差量子化モジュール
630 8分木デコーディングモジュール
640 LOD生成モジュール
650 属性予測モジュール
660 メモリ
700 順変換
800 逆変換
900A 順変換
900B 逆変換
1800 コンピュータシステム
1801 キーボード
1802 マウス
1803 トラックパッド
1805 ジョイスティック
1806 マイク
1807 スキャナ
1808 カメラ
1809 スピーカ
1810 タッチスクリーン
1820 CD/DVD ROM/RW
1821 光学媒体
1822 サムドライブ
1823 リムーバブルハードドライブまたはソリッドステートドライブ
1840 コア
1841 中央処理装置
1842 グラフィックス処理装置
1843 フィールドプログラマブルゲートエリア
1844 ハードウェアアクセラレータ
1845 読み取り専用メモリ
1846 ランダムアクセスメモリ
1847 大容量記憶装置
1848 システムバス
1849 周辺バス