(19)【発行国】日本国特許庁(JP)
(12)【公報種別】公表特許公報(A)
(11)【公表番号】
(43)【公表日】2024-11-06
(54)【発明の名称】点群コーディング方法、装置、及び媒体
(51)【国際特許分類】
G06T 9/00 20060101AFI20241029BHJP
【FI】
G06T9/00
【審査請求】有
【予備審査請求】未請求
(21)【出願番号】P 2024523667
(86)(22)【出願日】2022-10-20
(85)【翻訳文提出日】2024-05-20
(86)【国際出願番号】 CN2022126466
(87)【国際公開番号】W WO2023066345
(87)【国際公開日】2023-04-27
(31)【優先権主張番号】PCT/CN2021/125380
(32)【優先日】2021-10-21
(33)【優先権主張国・地域又は機関】CN
(81)【指定国・地域】
(71)【出願人】
【識別番号】520476341
【氏名又は名称】北京字節跳動網絡技術有限公司
【氏名又は名称原語表記】Beijing Bytedance Network Technology Co., Ltd.
【住所又は居所原語表記】Room B-0035, 2/F, No.3 Building, No.30, Shixing Road, Shijingshan District Beijing 100041 China
(71)【出願人】
【識別番号】520477474
【氏名又は名称】バイトダンス インコーポレイテッド
【氏名又は名称原語表記】BYTEDANCE INC.
【住所又は居所原語表記】12655 West Jefferson Boulevard, Sixth Floor, Suite No. 137 Los Angeles, California 90066 United States of America
(74)【代理人】
【識別番号】100107766
【氏名又は名称】伊東 忠重
(74)【代理人】
【識別番号】100229448
【氏名又は名称】中槇 利明
(72)【発明者】
【氏名】シュイ,インジャン
(72)【発明者】
【氏名】ザン,カイ
(72)【発明者】
【氏名】ザン,リー
(57)【要約】
本開示の実施形態は、点群コーディングのための方案を提供する。点群コーディング方法は、点群シーケンスをコーディングするための複数セットのシーケンスレベル・パラメータ(SLP)に基づいて、点群シーケンスと前記点群シーケンスのビットストリームとの間の変換を実行するステップを含み、前記複数セットのSLPは、前記ビットストリーム内で示される。従来の方案に比べて、提案した方法はコーディング効率を向上させることができるという利点を有する。
【選択図】
図9
【特許請求の範囲】
【請求項1】
点群コーディング方法であって、
点群シーケンスをコーディングするための複数セットのシーケンスレベル・パラメータ(SLP)に基づいて、点群シーケンスと前記点群シーケンスのビットストリームとの間の変換を実行するステップを含み、
前記複数セットのSLPは、ビットストリーム内で示される、
方法。
【請求項2】
前記複数セットのSLPを指す複数の指示は、前記ビットストリーム内で示される、
請求項1に記載の方法。
【請求項3】
前記複数の指示は、前記複数セットのSLPの少なくとも1セットのSLPを示す少なくとも1つのインデックスを含む、
請求項2に記載の方法。
【請求項4】
前記少なくとも1つのインデックスには、所定の番号から始まる番号が付けられる、
請求項3に記載の方法。
【請求項5】
前記所定の番号は0である、
請求項4に記載の方法。
【請求項6】
前記複数の指示は、
固定長コーディング、
単項コーディング、又は
切り捨て単項コーディングのうちの1つでコーディングされる、
請求項2~5のいずれか1項に記載の方法。
【請求項7】
前記複数の指示は、予測的にコーディングされる、
請求項2~5のいずれか1項に記載の方法。
【請求項8】
前記複数の指示は、それぞれ、前記複数セットのSLP内で示される、
請求項2~7のいずれか1項に記載の方法。
【請求項9】
前記複数セットのSLPは、前記点群シーケンスをコーディングするための第1構文構造内のパラメータを含み、
前記ビットストリーム内で前記点群シーケンスをコーディングするための第2構文構造内のパラメータを示すかどうかに関する情報、又は、前記ビットストリーム内で前記第2構文構造内の前記パラメータをどのように示すかに関する情報のうちの少なくとも1つは、前記第1構文構造内の前記パラメータに依存し、
前記第2構文構造のタイプは、前記第1構文構造のタイプと異なる、
請求項1~8のいずれか1項に記載の方法に記載の方法。
【請求項10】
前記第1構文構造は、シーケンス・パラメータセット(SPS)を含む、
請求項9に記載の方法。
【請求項11】
前記第2構文構造は、ジオメトリ・パラメータセット(GPS)又は属性パラメータセット(APS)を含む、
請求項9又は10に記載の方法。
【請求項12】
前記第1構文構造内の前記パラメータは、前記第2構文構造内の前記パラメータの前にシグナリングされる、
請求項9~11のいずれか1項に記載の方法。
【請求項13】
前記第2構文構造内の前記パラメータは前記ビットストリームに存在せず、前記第1構文構造内の前記パラメータは前記第2構文構造に使用される、
請求項9~11のいずれか1項に記載の方法。
【請求項14】
前記第2構文構造内の前記パラメータは、前記ビットストリーム内で述語的に示される、
請求項9~12のいずれか1項に記載の方法。
【請求項15】
前記第2構文構造内の前記パラメータは、前記第1構文構造内の前記パラメータに基づいて決定される、
請求項9~12のいずれか1項に記載の方法。
【請求項16】
前記第1構文構造はSPSであり、前記複数セットのSLPはGPS内のパラメータ及びAPS内のパラメータをさらに含む、
請求項9~12のいずれか1項に記載の方法。
【請求項17】
前記第1構文構造内の前記パラメータは、前記第2構文構造内の前記パラメータの前にコーディングされる、
請求項9~12のいずれか1項に記載の方法。
【請求項18】
前記複数セットのSLPは、前記点群シーケンスをコーディングするための複数のパラメータセットを含む、
請求項1~17のいずれか1項に記載の方法。
【請求項19】
前記複数のパラメータセットは、SPS、GPS、又はAPSのうちの少なくとも1つを含む、
請求項18に記載の方法。
【請求項20】
前記点群シーケンス内の点群サンプルのデータユニットをコーディングするためのパラメータセットは、活性化関数によって前記複数のパラメータセットから取得される、
請求項18又は19に記載の方法。
【請求項21】
前記データユニットは、
前記点群サンプルのジオメトリ・データ、又は、
前記点群サンプルの属性データのうちの少なくとも1つを含む、
請求項20に記載の方法。
【請求項22】
前記複数のパラメータセットを指す複数のパラメータセット指示は、第2レベルで前記ビットストリーム内に示され、
前記第2レベルは、シーケンスレベルよりも低い、
請求項18~21のいずれか1項に記載の方法。
【請求項23】
前記複数のパラメータセットを指す複数のパラメータセット指示が、第2レベルで前記ビットストリーム内に示されるか否かに関する情報は、シーケンスレベルでのパラメータセットの数に依存し、
前記第2レベルは、前記シーケンスレベルよりも低い、
請求項18~22のいずれか1項に記載の方法。
【請求項24】
前記複数のパラメータセット指示は、前記第2レベルで使用されるパラメータセットを示すインデックスを含む、
請求項22又は23に記載の方法。
【請求項25】
前記複数のパラメータセット指示は、
固定長コーディング、
単項コーディング、又は
切り捨て単項コーディングのうちの1つでコーディングされる、
請求項22~24のいずれか1項に記載の方法。
【請求項26】
前記複数のパラメータセット指示は、予測の方法でコーディングされる、
請求項22~24のいずれか1項に記載の方法。
【請求項27】
前記複数のパラメータセット指示の1つは、前記第2レベルのヘッダボックス内で示される、
請求項22~24のいずれか1項に記載の方法。
【請求項28】
前記複数のパラメータセット指示の1つは、前記点群サンプルの情報ユニット内の構成ボックス内で示される、
請求項22~24のいずれか1項に記載の方法。
【請求項29】
前記データユニットは、シーケンスレベルよりも低い第2レベルで関連付けられる、
請求項20又は21に記載の方法。
【請求項30】
前記第2レベルは、前記複数のパラメータセットのうちの少なくとも1つが割り当てられる、
請求項29に記載の方法。
【請求項31】
前記第2レベルのパラメータセットを指す指示は、前記第2レベルのヘッドボックス内で示され、前記指示は、前記パラメータセットを取得するために前記活性化関数によって使用される、
請求項29に記載の方法。
【請求項32】
前記データユニットはジオメトリ・データユニットであり、前記ジオメトリ・データユニットの前記活性化関数によって取得されたSPSは、他のデータユニットに使用される、請求項29に記載の方法。
【請求項33】
前記変換は、前記点群シーケンスを前記ビットストリームに符号化するステップを含む、
請求項1~32のいずれか1項に記載の方法。
【請求項34】
前記変換は、前記ビットストリームから前記点群シーケンスを復号するステップを含む、
請求項1~32のいずれか1項に記載の方法。
【請求項35】
プロセッサと命令を備える非一時的なメモリとを含む、点群データを処理する装置であって、
前記命令は、前記プロセッサによって実行されると、前記プロセッサに請求項1~34のいずれか1項に記載の方法を実行させる、装置。
【請求項36】
プロセッサに請求項1~34に記載の方法を実行させる命令を記憶する、
非一時的なコンピュータ可読記憶媒体。
【請求項37】
点群処理装置によって実行される方法で生成される、点群シーケンスのビットストリームを記憶する非一時的なコンピュータ可読記録媒体であって、前記方法は、
点群シーケンスをコーディングするための複数セットのシーケンスレベル・パラメータ(SLP)に基づいて、前記ビットストリームを生成するステップを含み、
前記複数セットのSLPは、前記ビットストリーム内で示される、
非一時的なコンピュータ可読記録媒体。
【請求項38】
点群シーケンスのビットストリームを記憶する方法であって、
点群シーケンスをコーディングするための複数セットのシーケンスレベル・パラメータ(SLP)に基づいて、前記ビットストリームを生成するステップと、
前記ビットストリームを非一時的なコンピュータ可読記録媒体内に記憶するステップと、を含み、
前記複数セットのSLPは、前記ビットストリームで示される、方法。
【発明の詳細な説明】
【技術分野】
【0001】
本開示の実施形態は、概して、点群コーディング技術に関し、より具体的には、点群コーディングにおけるコーディングパラメータのコーディング及びカプセル化に関する。
【背景技術】
【0002】
点群は、三次元(3D)平面内の個々のデータ点の集合であり、各点はX、Y、Z軸上に設定された座標を持つ。従って、点群は、三次元空間の物理的コンテンツを表すことに使用されることができる。点群は、拡張現実から自動運転車まで幅広い没入型アプリケーションの3Dビジュアルデータを表現する有望な方法であると判明されている。
【0003】
点群コーディング規格は、主によく知られているMPEG組織の発展を通じて進化してきた。MPEGは、Moving Picture Experts Groupの略であり、マルチメディアを扱う主な標準化グループの1つである。2017において、MPEG 3Dグラフィックスコーディンググループ(3DG)は、点群コーディング規格の開発を開始する発表募集(CFP)書類を発行した。最終的な規格は2つのクラスの方案を含むようになる。ビデオベースの点群圧縮(V-PCC又はVPCC)は、点が比較的均一に分布される点集合に適する。ジオメトリベースの点群圧縮(G-PCC又はGPCC)は、より疎な分布に適する。しかし、従来の点群コーディング技術のコーディング効率は、一般的に更なる改善が期待されている。
【発明の概要】
【0004】
本開示の実施形態は、点群コーディングの方案を提供する。
【0005】
第1態様では、点群コーディング方法を提案する。前記方法は、点群シーケンスをコーディングするための複数セットのシーケンスレベル・パラメータ(SLP)に基づいて、点群シーケンスと前記点群シーケンスのビットストリームとの間の変換を実行するステップを含み、前記複数セットのSLPは、ビットストリーム内で示される。
【0006】
本開示の第1態様による方法によれば、点群シーケンスをコーディングするための複数のコーディングオプションを提供する複数セットのSLPは、ビットストリーム内で示される。1セットのSLPのみがシグナリングされる従来の方案に比べて、提案した方法は、より高い柔軟性を提供できるという利点を有するため、コーディング品質及びコーディング効率を向上させる。
【0007】
第2態様では、点群データを処理する装置を提案する。前記点群データを処理する装置は、プロセッサと、命令が記憶される非一時的メモリとを含む。前記命令は、前記プロセッサによって実行されると、前記プロセッサに本開示の第1態様による方法を実行させる。
【0008】
第3態様では、非一時的なコンピュータ可読記憶媒体を提案する。前記非一時的なコンピュータ可読記憶媒体は、プロセッサに本開示の第1態様による方法を実行させる命令を記憶する。
【0009】
第4態様では、他の非一時的なコンピュータ可読記録媒体を提案する。非一時的なコンピュータ可読記録媒体は、点群処理装置によって実行される方法で生成される、点群シーケンスのビットストリームを記憶する。前記方法は、点群シーケンスをコーディングするための複数セットのシーケンスレベル・パラメータ(SLP)に基づいて、前記ビットストリームを生成するステップを含み、前記複数セットのSLPは、前記ビットストリーム内で示される。
【0010】
第5態様では、点群シーケンスのビットストリームを記憶するための方法を提案する。前記方法は、点群シーケンスをコーディングするための複数セットのシーケンスレベル・パラメータ(SLP)に基づいて、前記ビットストリームを生成することと、前記ビットストリームを非一時的なコンピュータ可読記録媒体内に記憶することと、を含み、前記複数セットのSLPは、前記ビットストリームで示される。
【0011】
この発明の概要は、以下の詳細な説明でさらに記述される概念の選択を簡略化した形で紹介するために提供される。この発明の概要は、請求される技術的事項の主な特徴又は本質的な特徴を特定することを意図したものではなく、また、請求される技術的事項の範囲を制限するために使用されることを意図したものでもない。
【図面の簡単な説明】
【0012】
添付の図面を参照した以下の詳細な説明を通じて、本開示の例示的な実施形態の上記及び他の目的、特徴、及び利点がより明らかになるであろう。本開示の例示的な実施形態では、同じ参照番号は、通常、同じコンポーネントを指す。
【0013】
【
図1】本開示の技術を利用できる例示的な点群コーディングシステムを示すブロック図である。
【0014】
【
図2】本開示のいくつかの実施形態による例示的な点群エンコーダを示すブロック図である。
【0015】
【
図3】本開示のいくつかの実施形態による例示的な点群デコーダを示すブロック図である。
【0016】
【
図4】コーディングされたG-PCCビットストリームが単一のトラックに記憶される場合のサンプル構造を示す概略図である。
【0017】
【
図5】G-PCCビットストリームのマルチトラックコンテナを示す概略図である。
【0018】
【
図6】サンプル情報の前にTLV内でSLPをシグナリングすることによる単一のトラック内のG-PCCビットストリームの一例を示す概略図である。
【0019】
【
図7】サンプル情報の前にシーケンス構成ボックス内でSLPをシグナリングすることによる単一のトラック内のG-PCCビットストリームの一例を示す概略図である。
【0020】
【
図8】グループレベル構造を使用することによる単一のトラック内のG-PCCビットストリームの一例を示す概略図である。
【0021】
【
図9】本開示のいくつかの実施形態による点群コーディング方法のフローチャートを示す。
【0022】
【
図10】本開示の様々な実施形態を実施できるコンピューティングデバイスのブロック図を示す。
【0023】
図面の全体にわたって、同じ又は類似の参照番号は、通常、同じ又は類似の要素を指す。
【発明を実施するための形態】
【0024】
以下、いくつかの実施形態を参照しながら本開示の原理を説明する。これらの実施形態は、例示の目的で、かつ、当業者が本開示を理解して実施することに寄与するために記載されるにすぎず、本開示の範囲に関していかなる限定も示唆しないと理解すべきである。本明細書に記載の開示は、以下に記載する方法以外にも、様々な方法で実施することができる。
【0025】
以下の説明及び特許請求の範囲において、別段の定義がない限り、本明細書で使用されるすべての技術用語及び科学用語は、本開示が属する技術分野の当業者によって一般に理解されるものと同じ意味を有する。
【0026】
本開示における「一つの実施形態」、「一実施形態」、「例示的な実施形態」などへの言及は、記載される実施形態が、特定の特徴、構造、又は特性を含み得ることを示すが、必ずしもすべての実施形態が、特定の特徴、構造、又は特性を含むとは限らない。また、そのような語句は、必ずしも同じ実施形態を指しているわけではない。さらに、特定の特徴、構造、又は特性が、例示的な実施形態に関連して説明される場合、明示的に記載されているかどうかにかかわらず、他の実施形態に関連して、そのような特徴、構造、又は特性に影響を与えることは、当業者の知識の範囲内であることが指摘される。
【0027】
「第1」及び「第2」などの用語は、本明細書では、様々な要素を説明するために使用され得るが、これらの要素は、これらの用語によって限定されるべきではないことを理解すべきである。これらの用語は、ある要素を別の要素と区別するためにのみ使用されている。例えば、例示的な実施形態の範囲から逸脱することなく、第1の要素が第2の要素と呼ばれ得る。同様に、第2の要素が第1の要素と呼ばれ得る。本明細書で使用される「及び/又は」という用語には、列挙された用語の1つ又は複数のあらゆる組み合わせが含まれる。
【0028】
本明細書で使用される用語は、特定の実施形態を説明することのみを目的としており、例示的な実施形態を限定することを意図したものではない。本明細書で使用されるように、単数形「a(一つの)」、「an(一つの)」、及び「the(その)」は、文脈上明らかに別段の指示がない限り、複数形も含むものとする。「含む」、「備える」、「有する」、「持つ」、「含む」、及び/又は「包含する」という用語は、本明細書で使用される場合、記載された特徴、要素、及び/又は、コンポーネントなど、の存在を特定するが、1つ又は複数の他の特徴、要素、コンポーネント、及び/又は、それらの組み合わせの存在又は追加を排除するものではないことが、さらに理解されるであろう。
【0029】
例示的な環境
以下、いくつかの実施形態を参照しながら本開示の原理を説明する。これらの実施形態は、例示の目的で、かつ、当業者が本開示を理解して実施することに寄与するために記載されるにすぎず、本開示の範囲に関していかなる限定も示唆しないと理解すべきである。本明細書に記載の開示は、以下に記載する方法以外にも、様々な方法で実施することができる。
【0030】
以下の説明及び特許請求の範囲において、別段の定義がない限り、本明細書で使用されるすべての技術用語及び科学用語は、本開示が属する技術分野の当業者によって一般に理解されるものと同じ意味を有する。
【0031】
本開示における「一つの実施形態」、「一実施形態」、「例示的な実施形態」などへの言及は、記載される実施形態が、特定の特徴、構造、又は特性を含み得ることを示すが、必ずしもすべての実施形態が、特定の特徴、構造、又は特性を含むとは限らない。また、そのような語句は、必ずしも同じ実施形態を指しているわけではない。さらに、特定の特徴、構造、又は特性が、例示的な実施形態に関連して説明される場合、明示的に記載されているかどうかにかかわらず、他の実施形態に関連して、そのような特徴、構造、又は特性に影響を与えることは、当業者の知識の範囲内であることが指摘される。
【0032】
「第1」及び「第2」などの用語は、本明細書では、様々な要素を説明するために使用され得るが、これらの要素は、これらの用語によって限定されるべきではないことを理解すべきである。これらの用語は、ある要素を別の要素と区別するためにのみ使用されている。例えば、例示的な実施形態の範囲から逸脱することなく、第1の要素が第2の要素と呼ばれ得る。同様に、第2の要素が第1の要素と呼ばれ得る。本明細書で使用される「及び/又は」という用語には、列挙された用語の1つ又は複数のあらゆる組み合わせが含まれる。
【0033】
本明細書で使用される用語は、特定の実施形態を説明することのみを目的としており、例示的な実施形態を限定することを意図したものではない。本明細書で使用されるように、単数形「a(一つの)」、「an(一つの)」、及び「the(その)」は、文脈上明らかに別段の指示がない限り、複数形も含むものとする。「含む」、「備える」、「有する」、「持つ」、「含む」、及び/又は「包含する」という用語は、本明細書で使用される場合、記載された特徴、要素、及び/又は、コンポーネントなど、の存在を特定するが、1つ又は複数の他の特徴、要素、コンポーネント、及び/又は、それらの組み合わせの存在又は追加を排除するものではないことが、さらに理解されるであろう。
例示的な環境
【0034】
図1は、本開示の技術を利用できる例示的な点群コーディングシステム100を示すブロック図である。図示されるように、点群コーディングシステム100はソースデバイス110及び宛先デバイス120を含み得る。ソースデバイス110は点群符号化デバイスとも呼ばれることができ、宛先デバイス120は点群復号化デバイスとも呼ばれることができる。動作中、ソースデバイス110は符号化された点群データを生成するように構成されることができ、宛先デバイス120はソースデバイス110により生成された符号化の点群データを復号するように構成されることができる。本開示の技術は、概して、点群データのコーディング(符号化及び/又は復号化)、即ち、点群圧縮のサポートを対象とする。コーディングは、点群データの圧縮及び/又は解凍に効果的であり得る。
【0035】
ソースデバイス100及び宛先デバイス120は、デスクトップコンピュータ、ノートブック(即ち、ラップトップ)コンピュータ、タブレットコンピュータ、セットトップボックス、スマートフォン及びモバイルフォンなどの電話機、テレビ、カメラ、ディスプレイデバイス、デジタルメディアプレーヤー、ビデオゲームコンソール、ビデオストリーミングデバイス、地上車両または海洋車両、宇宙船、航空機、ロボット、LIDARデバイス、衛星、拡張現実デバイスなど含む幅広いデバイスのいずれかを含み得る。いくつかの場合に、ソースデバイス100及び宛先デバイス120は、無線通信用に装備され得る。
【0036】
ソースデバイス100は、データソース112、メモリ114、GPCCエンコーダ116、及び入力/出力(I/O)インターフェース118を含み得る。宛先デバイス120は、入力/出力(I/O)インターフェース128、GPCCデコーダ126、メモリ124、及びデータコンシューマー122を含み得る。本開示によれば、ソースデバイス100のGPCCエンコーダ116及び宛先デバイス120のGPCCデコーダ126は、点群コーディングに関連する本開示の技術を適用するように構成され得る。従って、ソースデバイス100は符号化デバイスの一例を表し、宛先デバイス120は復号化デバイスの一例を表す。他の例では、ソースデバイス100及び宛先デバイス120は他のコンポーネント及び配置を含み得る。例えば、ソースデバイス100は、内部ソース又は外部ソースからデータ(例えば、点群データ)を受信し得る。同様に、宛先デバイス120は、本デバイス内にデータコンシューマーを含まず、外部のデータコンシューマーとインターフェースし得る。
【0037】
概して、データソース112は、点群データ(即ち、符号化されていない生点群データ)のソースを表し、点群データの連続した一連の「フレーム」を、フレームの点群データを符号化するGPCCエンコーダ116へ提供し得る。いくつかの例では、データソース112は点群データを生成する。ソースデバイス100のデータソース112は、例えば、1つ又は複数のビデオカメラ、以前に捕捉された点群データを格納するアーカイブ、3Dスキャナ又はLIDAR(Light Detection And Ranging)デバイス、及び/又は、データコンテンツプロバイダーから点群データを受信するためのデータフィードインターフェースなど、様々なカメラ又はセンサのいずれかのような点群キャプチャデバイスを含み得る。従って、いくつかの例では、データソース112は、LIDAR装置からの信号に基づいて点群データを生成し得る。代替的または追加的に、点群データは、スキャナ、カメラ、センサ又は他のデータからコンピュータにより生成されてもよい。例えば、データソース112は、点群データを生成してもよく、又は、ライブ点群データ、アーカイブされた点群データ、及びコンピュータにより生成された点群データの組み合わせを作成してもよい。いずれの場合にも、GPCCエンコーダ116は捕捉された点群データ、事前捕捉された点群データ、又はコンピュータにより生成された点群データを符号化する。GPCCエンコーダ116は、点群データのフレームを、受信順(「表示順」と呼ばれることもがる)からコーディングするためのコーディング順に並べ替え得る。GPCCエンコーダ116は符号化された点群データを含む1つ又は複数のビットストリームを生成し得る。そして、ソースデバイス100は、例えば、宛先デバイス120のI/Oインターフェース128による受信及び/又は取得のために、I/Oインターフェース118を介して符号化された点群データを出力する。符号化された点群データはI/Oインターフェース118を介してネットワーク130Aを通じて宛先デバイス120へ直接送信され得る。符号化された点群データは、宛先デバイス120によってアクセスされるように記憶媒体/サーバ130Bに記憶され得る。
【0038】
ソースデバイス100のメモリ114及び宛先デバイス120のメモリ124は汎用メモリを表し得る。いくつかの例では、メモリ114及びメモリ124は、生点群データ、例えば、データソース112からの生点群データ及びGPCCデコーダ126からの復号された生点群データを格納することができる。追加的または代替的に、メモリ114及びメモリ124は、例えばGPCCエンコーダ116及びGPCCデコーダ126のそれぞれによって実行可能なソフトウェア命令を格納してもよい。この例において、メモリ114及びメモリ124はGPCCエンコーダ116及びGPCCデコーダ126と別個に示されているが、GPCCエンコーダ116及びGPCCデコーダ126は機能上同様又は同等の目的で内部メモリを含み得ると理解すべきである。さらに、メモリ114及びメモリ124は、符号化された点群データ(例えばGPCCエンコーダ116からの出力、及びGPCCデコーダ126への入力)を格納し得る。いくつかの例では、メモリ114及びメモリ124の一部は、例えば、生点群データ、復号された点群データ、及び/又は符号化された点群データを格納するために1つ又は複数のバッファとして割り当てられ得る。例えば、メモリ114及びメモリ124は、点群データを格納し得る。
【0039】
I/Oインターフェース118及びI/Oインターフェース128は、無線送信機/受信機、モデム、有線ネットワーキングコンポーネント(例えば、イーサネットカード)、様々なIEEE802.11規格のいずれかに従って動作する無線通信コンポーネント、又は他の物理的コンポーネントを表し得る。I/Oインターフェース118及びI/Oインターフェース128が無線コンポーネントを含む例では、I/Oインターフェース118及びI/Oインターフェース128は、4G、4G-LTE(Long-Term Evolution)、LTEアドバンスト、5Gなどのようなセルラー通信規格に従って、符号化された点群データなどのデータを送信するように構成され得る。I/Oインターフェース118が無線送信機を含むいくつかの例では、I/Oインターフェース118及びI/Oインターフェース128は、IEEE802.11仕様などの他の無線規格に従って、符号化された点群データなどのデータを送信するように構成され得る。いくつかの例では、ソースデバイス100及び/又は宛先デバイス120は、それぞれのSoC(system-on-a-chip)デバイスを含み得る。例えば、ソースデバイス100は、GPCCエンコーダ116及び/又はI/Oインターフェース118に起因する機能を実行するSoCデバイスを含み得、宛先デバイス120は、GPCCデコーダ126及び/又はI/Oインターフェース128に起因する機能を実行するSoCデバイスを含み得る。
【0040】
本開示の技術は、自動運転車の間の通信、スキャナ、カメラ、センサ、ローカル又はリモートサーバなどの処理デバイスとの間の通信、地理的マッピング、又は他の応用などの様々な応用のいずれかをサポートする符号化及び復号化に適用されることができる。
【0041】
宛先デバイス120のI/Oインターフェース128は、ソースデバイス110から符号化されたビットストリームを受信する。符号化されたビットストリームは、点群を表す値を有する構文要素などのシグナリング情報を含み、当該シグナリング情報は、GPCCエンコーダ116によって定義され、GPCCデコーダ126によっても使用される。データコンシューマー122は復号されたデータを使用する。例えば、データコンシューマー122は、復号された点群データを使用して物理的オブジェクトの位置を決定し得る。いくつかの例では、データコンシューマー122は、点群データに基づいて画像を表示するためのディスプレイを含み得る。
【0042】
GPCCエンコーダ116及びGPCCデコーダ126は、それぞれ、1つ又は複数のマイクロプロセッサ、DSP(digital signal processor)、ASIC(application specific integrated circuit)、FPGA(field programmable gate array)、ディスクリートロジック、ソフトウェア、ハードウェア、ファームウェア又はそれらの組み合わせなどの様々な適切なエンコーダ及び/又はデコーダ回路のいずれかとして実装され得る。当該技術が部分的にソフトウェアで実装される場合、デバイスは、適切な非一時的なコンピュータ可読媒体にソフトウェア用の命令を格納し、そして、1つ又は複数のプロセッサを使用してハードウェアで命令を実行することで、本開示の技術を実行し得る。GPCCエンコーダ116及びGPCCデコーダ126の各々は、1つ又は複数のエンコーダ又はデコーダに含まされてよく、どちらがそれぞれのデバイス内の複合エンコーダ/デコーダ(コーデック))の一部として集積されてもよい。GPCCエンコーダ116及び/又はGPCCデコーダ126を含むデバイスは、1つ又は複数の集積回路、マイクロプロセッサ、及び/又は他のタイプのデバイスを含み得る。
【0043】
GPCCエンコーダ116及びGPCCデコーダ126は、ビデオ点群圧縮(VPCC)規格又はジオメトリ点群圧縮(GPCC)規格などのコーディング規格に従って動作し得る。本開示は、データを符号化又は復号する処理を含むフレームのコーディング(例えば、符号化及び復号化)を指す場合がある。符号化されたビットストリームは、通常、コーディング決定(例えば、コーディングモード)を表す構文要素の一連の値を含む。
【0044】
点群は、3D空間内の点集合を含み、点に関連付けられる属性を有する。属性は、R、G、BやY、Cb、Crなどの色情報、反射率情報、又は他の属性であり得る。点群は、LIDARセンサ及び3Dスキャナなどの様々なカメラやセンサによって取得される場合がり、コンピュータで生成される場合もある。点群データは、建築(造形)、グラフィックス(視覚化及びアニメーション用の3Dモデル)、及び自動車産業(ナビゲーションに使用されるLIDARセンサ)を含む様々な応用に使用されるが、これらに限定されない。
【0045】
図2は、本開示のいくつかの実施形態による、
図1に示すシステム100内のGPCCエンコーダ116の一例であり得るGPCCエンコーダ200の一例を示すブロック図である。
図3は、本開示のいくつかの実施形態による、
図1に示すシステム100内のGPCCデコーダ126の一例であり得るGPCCデコーダ300の一例を示すブロック図である。
【0046】
GPCCエンコーダ200及びGPCCデコーダ300の両方において、点群位置は最初にコーディングされる。属性コーディングは、復号されたジオメトリに依存する。
図2及び
図3において、領域適応階層変換(RAHT)ユニット218、表面近似ユニット212、RAHTユニット314及び表面近似合成ユニット310は、カテゴリ1のデータに通常使用されるオプションである。LOD(Level of Detail)生成ユニット220、リフティングユニット222、LOD生成ユニット316及び逆リフティングユニット318は、カテゴリ3のデータに通常使用されるオプションである。他のすべてのユニットはカテゴリ1とカテゴリ3との間で共通される。
【0047】
カテゴリ3のデータの場合に、圧縮されたジオメトリは、典型的に、根から個々のボクセルの葉レベルで至る八分木として表される。カテゴリ1のデータの場合に、圧縮されたジオメトリは、典型的に、プルーニングされた八分木(即ち、根からボクセルよりも大きいブロックの葉レベルまでの八分木)とプルーニングされた八分木の各葉内の表面を近似するモデルによって現れる。このようにして、カテゴリ1及び3のデータの両方は八分木のコーディングメカニズムを共有するが、カテゴリ1のデータは、それに加えて表面モデルを使用して各葉内のボクセルを近似し得る。使用される表面モデルは、ブロックごとに1~10個の三角形を含む三角形分割であり、三角形スープが生成される。カテゴリ1のジオメトリコーデックは、Trisoupジオメトリコーデックとして知られており、カテゴリ3ジオメトリのコーデックは、八分木ジオメトリコーデックとして知られている。
【0048】
図2の例では、GPCCエンコーダ200は、座標変換ユニット202、色変換ユニット204、ボクセル化ユニット206、属性転送ユニット208、八分木解析ユニット210、表面近似解析ユニット212、算術符号化ユニット214、ジオメトリ再構成ユニット216、RAHTユニット218、LOD生成ユニット220、リフティングユニット222、係数量子化ユニット224、及び算術符号化ユニット226を含み得る。
【0049】
図2の例に示されるように、GPCCエンコーダ200は、位置のセット及び属性のセットを受信し得る。位置は、点群における点の座標を含み得る。属性は、点群における点に関連つけられた色など、点群における点に関する情報を含み得る。
【0050】
座標変換ユニット202は、座標を初期領域から変換領域に変換するために、点の座標に変換を適用し得る。本開示は、変換された座標を変換座標と呼ぶことがある。色変換ユニット204は、属性の色情報を異なる領域に変換するために変換を適用し得る。例えば、色変換ユニット204は、色情報をRGB色空間からYCbCr色空間に変換し得る。
【0051】
さらに、
図2の例では、ボクセル化ユニット206は、変換座標をボクセル化し得る。変換座標のボクセル化は、量子化すること及び点群のいくつかの点を除去するステップを含み得る。言い換えれば、点群の複数の点は、単一の「ボクセル」内に包含されることができ、単一の「ボクセル」は、それ以降いくつかの観点において1つの点として扱われ得る。さらに、八分木解析ユニット210は、ボクセル化された変換座標に基づいて八分木を生成し得る。さらに、
図2の例では、表面近似解析ユニット212は、点を解析して点セットの表面表現潜在的に決定し得る。算術符号化ユニット214は、表面近似解析ユニット212によって決定された八分木及び/又は表面の情報を表す構文要素に対して算術符号化を実行し得る。GPCCエンコーダ200は、ジオメトリビットストリーム内でこれらの構文要素を出力し得る。
【0052】
ジオメトリ再構成ユニット216は、八分木、表面近似解析ユニット212によって決定された表面を示すデータ、及び/又は他の情報に基づいて、点群における点の変換座標を再構成し得る。ジオメトリ再構成ユニット216によって再構成された変換座標の数は、ボクセル化及び表面近似のため、点群の点の元の数と異なることがある。本開示では、得られる点を再構成された点と呼ぶことがある。属性転送ユニット208は、点群の元の点の属性を点群データの再構成された点に転送し得る。
【0053】
さらに、RAHTユニット218は、再構成された点の属性にRAHTコーディングを適用し得る。代替的または追加的に、LOD生成ユニット220及びリフティングユニット222は、それぞれ、再構成された点の属性にLOD処理及びリフティングを適用してもよい。RAHTユニット218及びリフティングユニット222は、属性に基づいて係数を生成し得る。係数量子化ユニット224は、RAHTユニット218又はリフティングユニット222によって生成された係数を量子化し得る。算術符号化ユニット226は、量子化された係数を表す構文要素に対して算術コーディングを適用し得る。GPCCエンコーダ200は、属性ビットストリーム内でこれらの構文要素を出力し得る。
【0054】
図3の例では、GPCCデコーダ300は、ジオメトリ算術復号化ユニット302、属性算術復号化ユニット304、八分木合成ユニット306、逆量子化ユニット308、表面近似合成ユニット310、ジオメトリ再構成ユニット312、RAHTユニット314、LOD生成ユニット316、逆リフティングユニット318、座標逆変換ユニット320、及び色逆変換ユニット322を含み得る。
【0055】
GPCCデコーダ300は、ジオメトリビットストリーム及び属性ビットストリームを取得し得る。デコーダ300のジオメトリ算術復号化ユニット302は、算術復号化(例えば、CABAC又は他のタイプの算術復号化)をジオメトリビットストリーム内の構文要素に適用し得る。同様に、属性算術復号化ユニット304は、算術復号化を属性ビットストリーム内の構文要素に適用し得る。
【0056】
八分木合成ユニット306は、ジオメトリビットストリームからパースされた構文要素に基づいて八分を合成し得る。表面近似がジオメトリビットストリームにおいて使用される事例では、表面近似合成ユニット310は、ジオメトリビットストリームからパースされた構文要素及び八分木に基づいて表面モデルを決定し得る。
【0057】
さらに、ジオメトリ再構成ユニット312は、点群の点の座標を決定するために再構成を実行し得る。座標逆変換ユニット320は、再構成された座標に逆変換して、点群の点の再構成された座標(位置)を変換領域から初期領域に戻して変換し得る。
【0058】
さらに、
図3の例では、逆量子化ユニット308は、属性値を逆量子化し得る。属性値は、(例えば、属性算術復号化ユニット304によって復号された構文要素を含む)属性ビットストリームから取得された構文要素に基づくものであり得る。
【0059】
属性値がどのように符号化されるかに応じて、RAHTユニット314は、RAHTコーディングを実行して、逆量子化された属性値に基づいて点群の点についての色値を決定し得る。代替的に、LOD生成ユニット316及び逆リフティングユニット318は、詳細レベルで基づく技法を使用して点群の点についての色値を決定してもよい。
【0060】
さらに、
図3の例では、色逆変換ユニット322は、色値に逆色変換を適用し得る。逆色変換は、エンコーダ200の色変換ユニット204によって適用された色変換の逆であり得る。例えば、色変換ユニット204は、色情報をRGB色空間からYCbCr色空間に変換し得る。よって、色逆変換ユニット322は、色情報をYCbCr色空間からRGB色空間に変換し得る。
【0061】
図2および
図3の様々なユニットは、エンコーダ200およびデコーダ300によって実施される動作の理解を支援するために示されている。ユニットは、固定機能回路、プログラマブル回路、またはそれらの組合せとして実装され得る。固定機能回路は、特定の機能を提供する回路を指し、実施され得る動作に関してあらかじめ設定される。プログラマブル回路は、様々なタスクを実施するとともに、実施され得る動作においてフレキシブルな機能を提供するようにプログラミングされることができる回路を指す。例えば、プログラマブル回路は、ソフトウェア又はファームウェアの命令によって定義された態様でプログラマブル回路を動作させるソフトウェア又はファームウェアを実行し得る。固定機能回路は、(例えば、パラメータを受信する、又は、パラメータを出力するために)ソフトウェア命令を実行し得るが、固定機能回路が実施する動作のタイプは、概して不変である。いくつかの例では、ユニットのうちの1つ又は複数は、別個の回路ブロック(固定機能またはプログラマブル)であり得、いくつかの例では、ユニットのうちの1つ又は複数は、集積回路であり得る。
【0062】
以下、本開示のいくつかの例示的な実施形態について詳細に説明する。本明細書では、理解を容易にするためにセクション見出しが使用されているが、セクションで開示される実施形態をそのセクションのみに限定するものではないことを理解すべきである。さらに、特定の実施形態が多用途のGPCC又は他の特定の点群コーデックを参照して説明するが、開示技術は、他の点群コーディング技術にも適用可能である。さらに、いくつかの実施形態は、点群コーディングステップを詳細に説明するが、コーディングを元に戻す対応のステップである復号化はデコーダによって実施されることが理解されるであろう。
1.概要
本開示は、点群コーディング技術に関する。特に、点群コーディングにおけるコーディングパラメータのコーディング及びカプセル化に関する。このアイデアは、点群コーディング規格、又は、例えば開発中のジオメトリベースの点群圧縮(G-PCC)の規格外の点群コーディングに個別に又は様々な組み合わせで適用され得る。
2.略語
G-PCC ジオメトリベースの点群圧縮
MPEG ムービングピクチャーエクスパーツグループ
3DG 3Dグラフィックスコーディンググループ
CFP 発表募集
V-PCC ビデオベースの点群圧縮
SPS シーケンスパラメータセット
GPS ジオメトリ・パラメータセット
APS 属性パラメータセット
TLV タイプ-長さ-値バイトストリーム形式
GSH ジオメトリ・データユニットヘッダ
ASH 属性データユニットヘッダ
GOF フレームグループ
SLP シーケンスレベル・パラメータ
GLP GOFレベル・パラメータ
FLP フレームレベル・パラメータ
ISOBMFF ISOベースのメディアファイル形式
3.背景
点群コーディング規格は、主によく知られているMPEG組織の発展を通じて進化してきた。MPEGは、Moving Picture Experts Groupの略であり、マルチメディアを扱う主な標準化グループの1つである。2017において、MPEG 3Dグラフィックスコーディンググループ(3DG)は、点群コーディング規格の開発を開始する発表募集(CFP)書類を発行した。最終的な規格は2つのクラスの方案を含むようになる。ビデオベースの点群圧縮(V-PCC)は、点が比較的均一に分布される点集合に適する。ジオメトリベースの点群圧縮(G-PCC)は、より疎な分布に適する。V-PCC及びG-PCCの両方は、単一の点群及び点群シーケンスのコーディング及び復号化をサポートする。
1つの点群シーケンスには、1つ又は複数の点群フレームがある。点群シーケンスは、1つ又は複数のフレームグループ(GOF)に分割されることができる。通常、各GOF内の点群フレームの数は同じであり、GOFサイズとして示される。
1つの点群フレームには、3Dオブジェクト又はシーンを記述するための多数のデータ点がある。データ点ごとに、対応するジオメトリ情報及び属性情報が存在し得る。ジオメトリ情報は、データ点の空間的位置を記録するために使用される。属性情報は、テクスチャ、法線ベクトル及び反射などのデータ点の詳細を記録するために使用される。通常、コーデックには、ジオメトリ情報及び属性情報のコーディング及び復号化をそれぞれサポートするオプションのツールが多数ある。
3.1コーディングパラメータ
エンコーダには、符号化処理を制御するためのいくつかのコーディングパラメータがある。その一部は、復号処理をサポートするためにデコーダにシグナリングされる。シグナリングされたパラメータは、復号処理における役割に応じて、シーケンスレベル・パラメータ(SLP)及びフレームレベルパラメータ(FLP)などの複数のレベルで分類され得る。
SLPは、点群シーケンスにおけるすべてのフレームの復号処理に適用されることができるパラメータである。1つの点群シーケンスに対して1つ又は複数のSLPグループが存在し得る。点群フレームごとに、1つのSLPグループが適応されることができる。さらに、SLPは、ジオメトリ・パラメータセット(GPS)、属性パラメータセット(APS)及びシーケンスパラメータセット(SPS)などのいくつかのクラスタに分類されて格納されることができる。ジオメトリコーディングツールを制御するパラメータは、GPSに格納される。属性コーディングツールを制御するパラメータは、APSに格納される。点群シーケンスの特徴を記述する、又は、コーディング処理全体を制御するほかのSLPは、SPSに格納されることができる。例えば、点群シーケンスの属性カテゴリ及びコーディング処理のデータ精度を記述するパラメータは、SPSに格納される。
FLPは、1つの点群フレームの復号処理にのみ適用できるパラメータである。点群フレーム間のFLPは、通常異なる。例えば、1つの点群フレームの点の数及びグローバル動きベクトルを記述するパラメータは、FLPとしてシグナリングされる。
3.2 ビットストリームカプセル化構造
G-PCCでは、エンコーダの出力は、コーディングされたジオメトリ・データ、属性データ、メイトデータ及びコーディングパラメータを格納する1つのビットストリームである。1つのTLV(Type-length-value)カプセル化構造は、G-PCCビットストリームの単位である。各TLVは、SPS、GPS、APS、タイルインベントリ、フレーム境界マーカー、ジオメトリ・データユニット、及び属性データユニットのうちの1つを含む。コーディングされたG-PCCビットストリームは、ISOBMFFファイル内の1つ又は複数のトラックとしてカプセル化される。
SLPはSPS、GPS及びAPSのうちの1つを含むパラメータセットTLVに格納される。
ジオメトリ・データ及びジオメトリコーディング用のFLPは、ジオメトリ・データユニットを含むジオメトリTLV内に格納される。GSH(Geometry Data Unit Header)は、各ジオメトリTLVのビットストリームの開始位置にあるカプセル化構造である。ジオメトリコーディング用のFLPは、GSHに格納される。
属性データ及び属性コーディング用のFLPは、属性データユニットを含む属性TLV内に格納される。ASH(Attribute Data Unit Header)は、各属性TLVのビットストリームの開始位置にあるカプセル化構造である。属性コーディング用のFLPは、ASHに格納される。
3.3 ISOBMFF内のG-PCCデータの単一のトラックによるカプセル化
G-PCCビットストリームが単一のトラックで運ばれる場合に、さらなる処理をせずにG-PCCビットストリームを単一のトラックに格納することで、単純なISOBMFFカプセル化が利用される。各サンプルは、1つ又は複数のG-PCCユニットで構成される。
図4は、G-PCCジオメトリ及び属性ビットストリームが単一のトラックに格納される場合のサンプル構造の一例を示す。この場合、各サンプルは、ジオメトリ・データユニットを含む少なくとも1つのG-PCCユニット、属性データユニットを含む0個又は複数のG-PCCユニット、及びパラメータセットを持つ0個又は複数のG-PCCユニットを有する。
G-PCCトラックは、サンプルエントリタイプが「gpe1」又は「gpeg」のGPCCSampleEntryを使用すべきである。
「gpe1」のサンプルエントリでは、すべてのSPS、GPS、APS、及びタイルインベントリパラメータセットがsetupUnit配列に存在すべきである。「gpeg」のサンプルエントリでは、パラメータセットは、当該配列又はストリームに存在し得る。
3.4 ISOBMFF内のG-PCCデータのマルチトラックによるカプセル化
G-PCCビットストリームがG-PCCコンポーネントごとに複数のトラックで運ばれる場合に、各G-PCCコンポーネントビットストリームは、個別のトラックにマッピングされる。G-PCCコンポーネントトラックはG-PCCジオメトリトラック及びG-PCC属性トラックの2種類を有する。トラック内の各サンプルは、ジオメトリ及び属性データユニットの両方を持つことなく、異なる属性データユニットの多重化ではなく、単一のG-PCCコンポーネントデータユニットを持つ少なくとも1つのG-PCCユニットを含む。G-PCC属性トラックは、色、反射率などの異なる属性サブストリームを多重化しない。
図5には、マルチトラックのISOBMFF G-PCCコンテナの全般的なレイアウトが示される。
同じG-PCCシーケンスに属するトラックは時間的に整合されている。異なるトラックにわたって同じ点群フレームに寄与するサンプルは、同じ存在時間を有する。パラメータセット又はタイルインベントリがサンプル内に存在する場合に、このようなサンプルに使用されるパラメータセット又はタイルインベントリの復号時間は、対応するG-PCCコンポーネントデータユニットのサンプルの復号時間と等しいか、又はそれよりも前であるべきである。すべてのパラメータセットが複数のトラックにわたるサンプルに存在する場合に、SPSを含むサンプルの復号時間は、GPS、APS、又はタイルインベントリを含むサンプルの復号時間と等しいか、又はそれよりも前であるべきである。加えて、同じG-PCCシーケンスに属するすべてのトラックは、同じ暗黙的又は明示的な編集リストを有すべきである。
G-PCCジオメトリトラック又はG-PCC属性トラックは、サンプルエントリタイプが「gpc1」又は「gpcg」のGPCCSampleEntryを使用すべきである。
「gpc1」のサンプルエントリでは、G-PCCジオメトリトラックのsetupUnit配列は、すべてのSPS、GPS、及びタイルインベントリを含むべきである。G-PCC属性トラックのsetupUnit配列は、すべての関連するAPSを含むべきであり、SPS、GPS、及びタイルインベントリのいずれも含むべきではない。
「gpcg」のサンプルエントリでは、SPS、GPS、又はタイルインベントリは、サンプルエントリのsetupUnit配列又はG-PCCジオメトリトラックのストリームに存在し得る。APSは、サンプルエントリのsetupUnit配列又はG-PCC属性トラックのストリームに存在し得る。SPS、GPS、及びタイルインベントリのいずれもG-PCC属性トラック内に存在すべきではない。
4.問題点
点群圧縮におけるコーディングパラメータのコーディング及びカプセル化のための既存の設計は、以下のような問題がある:
1.現在のG-PCCでは、SLPは、1つの点群シーケンス内の点群フレームやサンプルごとに繰り返してコーディングされてカプセル化される。しかし、1つの点群シーケンス内のすべての点群フレームに対して、使用されるSLPグループはフレーム間で不変であり得る。従って、G-PCCビットストリームには、繰り返されたSLP情報を記録するために使用される不要なビットがいくつか存在する。
2.現在のG-PCCでは、GOFレベルパラメータ(GLP)のコーディングのための設計が存在しない。実際のGOFのサイズ(GLPであることもある)などのいくつかのコーディングパラメータは、1つのGOF内のすべての点群フレームに対して不変である。これらのコーディングパラメータは、FLPとして処理され、1つのGOF内の点群フレームごとに繰り返してコーディングされる。従って、点群エンコーダの出力には、繰り返されたSLP情報を記録するために使用される不要なビットがいくつか存在する。
3.現在のG-PCCでは、GLPのカプセル化のための設計が存在しない。GLP情報を記録するために使用されるコーディングパラメータセットビットストリームは、複数のボックス内に繰り返してカプセル化される。しかし、GLPビットストリームは、通常、1つのGOFにおけるすべての点に対して同じである。従って、G-PCCビットストリームには、繰り返された情報を格納するために使用される不要な構造がいくつか存在する。
5.詳細な解決方案
上記の問題及び言及していない他のいくつかの問題を解決するために、以下のように要約される方法を開示する。解決方案は、一般的な概念を説明するための例として考慮されるべきであり、狭く解釈されるべきではない。さらに、これらの解決方案は、任意の態様で組み合わせて適用することもできる。
以下の説明では、SLPは、SPS/GPS/APSなど、特定の既存の構文要素内のコーディングパラメータを含むが、これに限定されない。
1)1つの点群シーケンスで1つ又は複数セットのSLP情報をシグナリングすることを提案する。
a)一例では、各パラメータセットを指す少なくとも1つの指示が存在し得る。
i.指示は、関連するパラメータセットを示すいくつかのインデックス(例えば、sps_seq_parameter_set_id/gps_geom_parameter_set_id/aps_attr_parameter_set_id)によって表され得る。
(1)1セットのSLP情報のみが存在する場合に、インデックスは0に設定され得る。
(2)複数セットのSLP情報が存在する場合に、インデックスは0から始まり得る。
ii.指示は、固定長コーディング、単項コーディング(unary coding)、切り捨て単項コーディング(truncated unary coding)などでコーディングされ得る。
iii.指示は、予測の方法でコーディングされ得る。
iv.一例では、指示は、各パラメータセット内でシグナリングされ得る。
2)第1構文構造内のパラメータを、第2構文構造内のパラメータの前にシグナリングすることを提案する。
a)例えば、第1構文構造は、SPSであり得る。
b)例えば、第2構文構造は、GPS/APSであり得る。
c)一例では、第2構文構造内のパラメータは、条件付きでシグナリングされ得る。
i.一例では、第2構文構造内のパラメータをシグナリングするか否か/どのようにシグナリングするかは、第1構文構造内でシグナリングされたパラメータに依存し得る。
ii.一例では、第1構文構造内でシグナリングされたパラメータが第2構文構造に使用されることと示される場合に、第2構文構造内のパラメータはシグナリングされなくてもよい。
iii.一例では、第2構文構造内のパラメータがシグナリングされない場合に、第1構文構造内でシグナリングされたパラメータは、第2構文構造に使用される。
d)一例では、第2構文構造内のパラメータは、予測の方法でシグナリングされ得る。
i.例えば、第2構文構造内のパラメータは、第1構文構造内のパラメータによって予測され得る。
e)一例では、SLP情報は、SPS、GPS及びAPS内のパラメータで構成され得る。
f)一例では、SPS内のパラメータは、GPS/APS内のパラメータのシグナリングに使用され得る。
g)一例では、SPS内のパラメータは、GPS/APS内のパラメータの前にシグナリングされ得る。
h)一例では、SPS内のパラメータは、GPS/APS内のパラメータの前に復号され得る。
3)1つ又は複数のTLV内にSLP情報をグループ化してシグナリングすることを提案する。
a)一例では、SLP情報は、サンプル情報の前又は後にシグナリングされ得る。
b)一例では、1つ又は複数セットのSLP情報は、SPS TLV/GPS TLV/APS TLVなどの第1レベル構造でシグナリングされ得る。
c)或いは、さらに、何セットのSLP情報に対する指示は、ビットストリーム内でシグナリングされ得る。
d)一例では、SLP情報は、第2レベル構造(例えば、フレーム/ピクチャ/スライス/タイル/サブピクチャ)の前にシグナリングされ得る。
e)さらに、第2レベル構造で、少なくとも1セットのSLP情報を指す少なくとも1つの指示は、さらにシグナリングされ得る。
(1)指示は、例えば、第1レベルで複数セットのSLP情報があるか否かに応じて、条件付きでシグナリングされ得る。
(2)指示は、現在の第2レベル(例えば、現在の点群フレーム)を処理するために適用されるSLP情報の関連セットを示すいくつかのインデックス(例えば、SLP_SPS_id/SLP_GPS_id/SLP_APS_id)によって表され得る。
(3)指示は、固定長コーディング、単項コーディング、切り捨て単項コーディングなどでコーディングされ得る。
(4)指示は、予測の方法でコーディングされ得る。
(5)一例では、指示は、GSH/ASH内でシグナリングされ得る。
(6)或いは、指示は、サンプルエントリ内の構成ボックス内でシグナリングされ得る。
4)フレームごとにパラメータTLV内でSLP情報をシグナリングすることの代わりに、すべてのサンプル情報の前に1つのシーケンス構成ボックス内にSLP情報をグループ化してシグナリングすることを提案する。「シーケンス構成ボックス」は、少なくとも1つのシーケンスレベル構文要素を含む構文構造を参照し得る。
a)一例では、1つ又は複数セットのSLP情報は、第1レベルでの1つのシーケンス構成ボックス内でシグナリングされ得る。
b)或いは、さらに、何セットのSLP情報に対する指示は、ボックスヘッダ内でシグナリングされ得る。
c)一例では、SLP情報は、第2レベル(例えば、フレーム/ピクチャ/スライス/タイル/サブピクチャ)の前にシグナリングされ得る。
i.さらに、第2レベルで、少なくとも1セットのSLP情報を指す少なくとも1つの指示は、さらにシグナリングされ得る。
(1)指示は、例えば、第1レベルで複数セットのSLP情報があるか否かに応じて、条件付きでシグナリングされ得る。
(2)指示は、現在の第2レベル(例えば、現在のピクチャ)を処理するために適用されるSLP情報の関連セットを示すいくつかのインデックス(例えば、SLP_sequence_parameters_id/SLP_geometry_parameters_id/SLP_attribute_paramteters_id)によって表され得る。
(3)指示は、固定長コーディング、単項コーディング、切り捨て単項コーディングなどでコーディングされ得る。
(4)指示は予測的にコーディングされ得る。
(5)一例では、指示は、例えばSPS/GPS/APSの特定の既存の構文要素でシグナリングされ得る。
5)シーケンスの最初のサンプルについて、又は、現在のサンプルのSLP情報が同じ又は異なるフレーム内にある以前の復号されたサンプルのSLP情報と異なる場合に、SLP情報をシグナリングすることを提案する
a)一例では、1つ又は複数セットのSLP情報は、1つの点群シーケンスでシグナリングされ得る。
b)一例では、第2レベル(例えば、フレーム/ピクチャ/スライス/タイル/サブピクチャ)で、少なくとも1つの指示は、現在のサンプルのSLP情報が以前の復号されたサンプルのSLP情報と異なるか否かを示すためにシグナリングされ得る。
i.或いは、現在のサンプルのSLP情報が以前の復号されたサンプルのSLP情報と異なるか否かは暗黙的に導出され得る。
ii.指示は、例えば、第1レベルで複数セットのSLP情報があるか否かに応じて、条件付きでシグナリングされ得る。
iii.指示は、現在のサンプルのSLP情報が以前の復号されたサンプルのSLP情報と異なるか否かを示すいくつかのインデックス(例えば、SPS_unchanged_flag/GPS_unchanged_flag/APS_unchanged_flag)によって表され得る。
iv.指示は、固定長コーディング、単項コーディング、切り捨て単項コーディングなどでコーディングされ得る。
v.指示は予測的にコーディングされ得る。
vi.一例では、指示は、例えばSPS/GPS/APSの特定の既存の構文要素でシグナリングされ得る。
c)一例では、SLP情報が以前の復号されたサンプルのSLP情報と異なる場合に、SLP情報は、サンプルエントリ内の1つ又は複数のTLV(例えば、SPS TLV/GPS TLV/APS TLV)内でシグナリングされ得る。
d)一例では、SLP情報が以前のサンプルのSLP情報と異ならない場合に、以前の復号されたサンプルのSLP情報は、現在のサンプルによって継承され、適用され得る。
6)最初のサンプルについて、又は、現在のサンプルのSLP情報が同じ又は異なるフレーム内にある以前のすべての復号されたサンプルのSLP情報と異なる場合に、SLP情報をシグナリングすることを提案する
a)一例では、1つ又は複数セットのSLP情報は、1つの点群シーケンスでシグナリングされ得る。
b)一例では、第2レベル(例えば、フレーム/ピクチャ/スライス/タイル/サブピクチャ)で、少なくとも1つの指示は、現在のサンプルのSLP情報が以前のすべての復号されたサンプルのSLP情報と異なるか否かを示すためにシグナリングされ得る。
i.或いは、現在のサンプルのSLP情報が以前のすべての復号されたサンプルのSLP情報と異なるか否かは暗黙的に導出され得る。
ii.指示は、例えば、第1レベルで複数セットのSLP情報があるか否かに応じて、条件付きでシグナリングされ得る。
iii.指示は、現在のサンプルのSLP情報が以前のすべての復号されたサンプルのSLP情報と異なるか否かを示すいくつかのインデックス(例えば、SPS_new_flag/GPS_new_flag/APS_new_flag)によって表され得る。
iv.指示は、固定長コーディング、単項コーディング、切り捨て単項コーディングなどでコーディングされ得る。
v.指示は予測的にコーディングされ得る。
vi.一例では、指示は、例えばSPS/GPS/APSの、特定の既存の構文要素でシグナリングされ得る。
c)一例では、SLP情報が以前のすべての復号されたサンプルのSLP情報と異なる場合に、SLP情報は、サンプルエントリ内の1つ又は複数のTLV(例えば、SPS TLV/GPS TLV/APS TLV)内でシグナリングされ得る。
d)一例では、SLP情報が以前の復号されたサンプルのSLP情報と異ならない場合に、以前の復号されたサンプルの1つのSLP情報は、現在のサンプルによって継承され、適用され得る。
e)或いは、さらに、SLP情報がどのサンプルから継承されるかの指示は、現在のサンプルに対してさらにシグナリングされ得る。
i.当該指示は、例えば、SLP情報が他のサンプルから継承されるか否かに応じて、条件付きでシグナリングされ得る。
ii.指示は、固定長コーディング、単項コーディング、切り捨て単項コーディングなどでコーディングされ得る。
iii.指示は予測的にコーディングされ得る。
iv.一例では、指示は、例えばSPS/GPS/APSの、特定の既存の構文要素でシグナリングされ得る。
7)活性化関数を使用して各データユニットのパラメータセットを取得することを提案する。
a)一例では、1つ又は複数のグループのパラメータセッは、1つの点群シーケンスでシグナリングされ得る。
b)さらに、第2レベル構造(例えば、フレーム/ピクチャ/スライス/タイル/サブピクチャ)で、少なくとも1グループのパラメータセットを指す少なくとも1つの指示は、さらにシグナリングされ得る。
i.指示は、例えば、第1レベルで複数グループのパラメータセットがあるか否かに応じて、条件付きでシグナリングされ得る。
ii.指示は、現在の第2レベルを処理するために適用されるパラメータの関連セットを示すいくつかのインデックス(例えば、gsh_seq_parameter_set_id/gsh_geom_parameter_set_id/ash_seq_parameter_set_id /ash_attr_parameter_set_id)によって表され得る。
iii.指示は、固定長コーディング、単項コーディング、切り捨て単項コーディングなどでコーディングされ得る。
iv.指示は、予測の方法でコーディングされ得る。
v.一例では、指示は、各第2レベルのヘッダボックス(例えば、GSH/ASH)内でシグナリングされ得る。
vi.或いは、指示は、サンプルエントリ内の構成ボックス内でシグナリングされ得る。
c)一例では、現在の第2レベルのパラメータセットを取得するために活性化関数が存在し得る。
i.一例では、各第2レベルは、特定のパラメータセット(例えば、SPS/GPS/APS)が割り当てられ得る。
ii.一例では、各パラメータセット内の指示及び各第2レベルのヘッダボックス内の指示は、現在の第2レベルを処理するための特定のパラメータセットを取得するために活性化関数で使用され得る。
iii.一例では、1つのジオメトリ・データユニット内でアクティベーション関数によってSPSが取得されると、SPSは、1グループのパラメータセットのみが存在する場合に他の活性化に使用され得る。
8)GOFのサンプル情報の前に、1つのTLV内にGOFのGLP情報をグループ化してシグナリングすることを提案する。
a)一例では、1つ又は複数セットのGLP情報は、GOFレベルでシグナリングされ得る。
b)一例では、各セットのGLP情報は、1つのGOFに対して1つのGLP TLVでシグナリングされ得る。
c)一例では、1つのGOFのGLP情報は、GOF内のサンプル(例えば、フレーム/ピクチャ/スライス/タイル/サブピクチャ)情報の前にシグナリングされ得る。
d)一例では、1つのGOFのGLP情報は、GOFにおけるすべてのサンプルに適用されることができる。
6.実施形態
1)本実施形態は、どのようにSLP情報を1つ又は複数のTLV内にグループ化してシグナリングする一例を説明する。
エンコーダでは、まず、エンコーダは、すべての点群フレームのジオメトリ情報及び属性情報の前にSLP情報をグループ化して符号化する:
1.SPS内の各コーディングパラメータを1つのSPS_TLV内に符号化する。SPS_TLVごとに、パラメータセットを示すSPS_idがある。
2.GPS内の各コーディングパラメータを1つのGPS_TLV内に符号化する。GPS_TLVごとに、パラメータセットを示すGPS_idがある。
3.APS内の各コーディングパラメータを1つのAPS_TLV内に符号化する。APS_TLVごとに、パラメータセットを示すAPS_idがある。
次に、FLP情報は、点群フレームごとにジオメトリ情報及び属性情報とともに符号化される。フレームごとに、現在のフレームがSLPのどのセットを適用しているかことを示すSLP_SPS_id/SLP_GPS_id/SLP_APS_idの3つのインデックスがある。
1.各インデックスをGSH/ASH内に符号化する。
2.FLP情報を1つのGSH/ASH内に符号化する。
図6は、単一のトラックに格納されるG-PCCビットストリームの一例を示す。この場合、SLP情報は、サンプルエントリの前に複数のTLV内にグループ化されてシグナリングされる。
デコーダでは、まず、デコーダは、SPS_TLV/GPS_TLV/APS_TLV内のすべてのSLP情報を復号する。
次に、フレームごとに、
1.GSH/ASH内のSLP_SPS_id/SLP_GPS_id/SLP_APS_idを復号する。
2.1つのGSH/ASH内のFLP情報を復号する。
3.SLP_SPS_id/SLP_GPS_id/SLP_APS_idを使用してSLP情報を取得する。
4.SLP及びFLPを使用してジオメトリ情報及び属性情報を復号する。
2)本実施形態は、どのようにすべてのサンプル情報の前にSLP情報を1つのシーケンス構成ボックス内にグループ化してシグナリングする一例を説明する。
エンコーダでは、まず、すべての点群フレームのジオメトリ情報及び属性情報の前にSLP情報をグループ化して符号化する:
1.SPS内の各コーディングパラメータを符号化して、コーディングされた情報をシーケンス構成ボックス内に格納する。SPSパラメータのセットごとに、パラメータセットを示すSPS_IDがある。
2.GPS内の各コーディングパラメータを符号化して、コーディングされた情報をシーケンス構成ボックス内に格納する。GPSパラメータのセットごとに、パラメータセットを示すGPS_IDがある。
3.APS内の各コーディングパラメータを符号化して、コーディングされた情報をシーケンス構成ボックス内に格納する。APSパラメータのセットごとに、パラメータセットを示すAPS_IDがある。
次に、フレームごとに、現在のフレームがSLPのどのセットを適用しているかことを示すSLP_sequence_parameters_ID/SLP_geometry_parameters_ID/SLP_attribute_parameters_IDの3つのインデックスがある。これらのインデックスは、それぞれ、符号化されてSPS/GPS/APSに格納される。
そして、FLP情報は、点群フレームごとにジオメトリ情報及び属性情報とともにGSH/ASH内に符号化される。
図7は、単一のトラックに格納されるG-PCCビットストリームの一例を示す。この場合、SLP情報は、サンプルエントリの前に1つのシーケンス構成ボックス内にグループされてシグナリングされる。
デコーダでは、まず、デコーダは、シーケンス構成ボックス内のすべてのSLP情報を復号する。
次に、フレームごとに、
1.SPS/GPS/APS内のDecodeSLP_sequence_parameters_ID/SLP_geometry_parameters_ID/SLP_attribute_parameters_IDを復号する。
2.1つのGSH/ASH内のFLP情報を復号する。
3.SLP_sequence_parameters_ID/SLP_geometry_parameters_ID/SLP_attribute_parameters_IDを使用してSLP情報を取得する。
4.SLP及びFLPを使用してジオメトリ情報及び属性情報を復号する。
3)本実施形態は、シーケンスの最初のサンプルについて、又は、現在のサンプルのSLP情報が以前の復号されたサンプルのSLP情報と異なる場合にどのようにSLP情報をシグナリングする一例を説明する。
エンコーダでは、まず、エンコーダは、最初の点群フレームについてSLP情報を符号化してSPS/GPS/APS内に格納する。
次に、他のフレームについて、エンコーダは、現在のフレームのSLP情報が以前の符号化されたフレームのSLP情報と異なるか否かをチェックし、チェック結果を示す3つのフラグを符号化する。これらのフラグは、それぞれ、符号化されてSPS/GPS/APS内に格納される。
1.現在のフレームのSPS情報が以前の符号化されたフレームのSPS情報と同じである場合に、フラグSPS_unchange_flagは1に設定される。現在のフレームのSPS情報が以前の符号化されたフレームのSPS情報と異なる場合に、フラグSPS_unchange_flagは0に設定される。
2.現在のフレームのGPS情報が以前の符号化されたフレームのGPS情報と同じである場合に、フラグGPS_unchange_flagは1に設定される。現在のフレームのGPS情報が以前の符号化されたフレームのGPS情報と異なる場合に、フラグGPS_unchange_flagは0に設定される。
3.現在のフレームのAPS情報が以前の符号化されたフレームのAPS情報と同じである場合に、フラグAPS_unchange_flagは1に設定される。現在のフレームのAPS情報が以前の符号化されたフレームのAPS情報と異なる場合に、フラグAPS_unchange_flagは0に設定される。
そして、現在のフレームのSLP情報が以前の符号化されたフレームのSPS情報と異なる場合に、現在のフレームについてSLP情報を符号化してSPS/GPS/APS内に格納する。
FLP情報は、点群フレームごとにジオメトリ情報及び属性情報とともにGSH/ASH内に符号化される。
この場合、ビットストリーム構造は、特定の単一のトラック構造を利用することができる。
デコーダでは、まず、デコーダは、最初のフレームについてSLP情報を復号する。
次に、他のフレームについて、
1.SPS/GPS/APS内のSPS_unchange_flag/GPS_unchange_flag/APS_unchange_flagを復号する。
2.フラグが0に設定される場合に、1つのSPS/GPS/APS内のSLP情報を復号する。それ以外の場合に、以前の復号されたフレームからSLP情報を継承する。
3.GSH/ASHからFLP情報を復号する。
4.SLP及びFLPを利用してジオメトリ情報及び属性情報を復号する。
4)本実施形態は、最初のサンプルについて、又は、現在のサンプルのSLP情報が以前のすべての復号されたサンプルのSLP情報と異なる場合にどのようにSLP情報をシグナリングする一例を説明する。
エンコーダでは、まず、エンコーダは、最初の点群フレームについてSLP情報を符号化してSPS/GPS/APS内に格納する。SLP情報及びframe_idは1つの配列SLP_arrayに記録される。
次に、他のフレームについて、エンコーダは、現在のフレームのSLP情報がSLP_array内のすべてのSLP情報と異なるか否かをチェックし、チェック結果を示す3つのフラグを符号化する。これらのフラグは、それぞれ、符号化されてSPS/GPS/APS内に格納される。
1.現在のフレームのSPS情報がSLP_array内の1つのSPS情報と同じである場合に、フラグSPS_new_flagは0に設定される。現在のフレームのSPS情報がSLP_array内のすべてのSPS情報と異なる場合に、フラグSPS_new_flagは1に設定される。
2.現在のフレームのGPS情報がSLP_array内の1つのGPS情報と同じである場合に、フラグGPS_new_flagは0に設定される。現在のフレームのGPS情報がSLP_array内のすべてのGPS情報と異なる場合に、フラグGPS_new_flagは1に設定される。
3.現在のフレームのAPS情報がSLP_array内の1つのAPS情報と同じである場合に、フラグAPS_new_flagは0に設定される。現在のフレームのAPS情報がSLP_array内のすべてのAPS情報と異なる場合に、フラグAPS_new_flagは1に設定される。
そして、現在のフレームについて、
1.現在のフレームのSLP情報がSLP_array内のすべてのSLP情報と異なる場合に、SLP情報を符号化してSPS/GPS/APSに格納し、現在のフレームのSLP情報及びframe_idをSLP_array内に記録する。
2.現在のフレームのSLP情報がSLP_array内のいずれか1つのSLP情報と同じである場合に、現在のフレームと同じSLP情報を共有するフレームのframe_idを符号化してSPS/GPS/APS内に格納する。
FLP情報は、点群フレームごとにジオメトリ情報及び属性情報とともにGSH/ASH内に符号化される。
この場合、ビットストリーム構造は、特定の単一のトラック構造を利用することができる
デコーダでは、まず、デコーダは、最初のフレームについてSLP情報を復号する。
次に、他のフレームについて:
1.SPS/GPS/APS内のSPS_new_flag/GPS_new_flag/APS_new_flagを復号する。
2.フラグが1に設定される場合に、1つのSPS/GPS/APS内のSLP情報を復号する。それ以外の場合に、frame_idを復号して当該frame_idで示される、対応の復号されたフレームからSLP情報を継承する。
3.GSH/ASHからFLP情報を復号する。
4.SLP及びFLPを利用してジオメトリ情報及び属性情報を復号する。
5)本実施形態は、どのようにGOFのサンプル情報の前にGOFのGLP情報を1つのTLV内にグループ化してシグナリングする一例を説明する 。
点群コード化ビットストリームが単一のトラックで運ばれる場合に、SPS、GPS及びAPSを含むために、トラックヘッダには1つのシーケンス構成ボックスが存在し得る。
単一のトラック内には、いくつかのサンプルがある。当該サンプルは、1つ又は複数のサンプルグループに分割されることができる。サンプルグループごとに、GLPセットを含む構成ボックスが1グループあり得る。各サンプルは、1つ又は複数のG-PCCユニットで構成される。
図8は、この場合の単一のトラックに格納されるG-PCCビットストリームの一例を示す。
【0063】
本開示の実施形態は、点群コーディングにおけるコーディングパラメータのコーディング及びカプセル化に関する。本明細書で使用される場合、「点群シーケンス」という用語は、1つ又は複数の点群のシーケンスを指し得る。「フレーム」という用語は、点群シーケンス内の点群を指し得る。「サンプル」という用語は、フレームの一部または全体を指し得る。
【0064】
図9は、本開示のいくつかの実施形態による点群コーディング方法900のフローチャートを示す。方法900は、点群シーケンスと点群シーケンスのビットストリームとの間の変換中に実施され得る。
図9に示されるように、方法900は、点群シーケンスをコーディングするための複数セットのSLPに基づいて変換を実行する902で開始する。複数セットのSLPはビットストリーム内で示される。一例として、1セットのSLPのみをシグナリングするのではなく、3セットのSLPをシグナリングし得る。3セットのSLPのうち、第1セットのSLPは、点群シーケンスの第1点群サンプルをコーディングするように選択され得、3セットのSLPのうち、第2セットのSLPは、点群シーケンスの第2点群サンプルをコーディングするように選択され得る。一例では、変換は、点群シーケンスをビットストリームに符号化するステップを含み得る。代替的または追加的に、変換は、ビットストリームから点群シーケンスを復号するステップを含み得る。上記の例は、単に説明を目的として記載されたものであること理解すべきである。本開示の範囲は、これに限定されない。
【0065】
方法900によれば、点群シーケンスをコーディングするための複数のコーディングオプションを提供する複数セットのSLPは、ビットストリーム内で示される。1セットのSLPのみがシグナリングされる従来の方案に比べて、提案した方法は、より高い柔軟性を提供できるという利点を有するため、コーディング品質及びコーディング効率を向上させる。
【0066】
いくつかの実施形態では、複数セットのSLPを指す複数の指示は、ビットストリーム内で示され得る。一例では、複数の指示は、複数セットのSLPのうち、少なくとも1セットのSLPを示す少なくとも1つのインデックスを含み得る。例えば、インデックスsps_seq_parameter_set_idは、複数セットのSLP内のシーケンスパラメータセット(SPS)を示すために使用され得、インデックスgps_geom_parameter_set_idは、複数セットのSLP内のジオメトリパラメータセット(GPS)を示すために使用され得、及び/又は、インデックスaps_attr_parameter_set_idは、複数セットのSLP内の属性パラメータセット(APS)を示すために使用され得る。上記の例は、単に説明を目的として記載されたものであること理解すべきである。本開示の範囲は、これに限定されない。一例では、少なくとも1つのインデックスには所定の番号から始まる番号が付けられ得る。一例として、所定の番号は0である。少なくとも1つのインデックスには他の適切な番号から始まる番号が付けられ得ることを理解すべきである。本開示の範囲は、これに限定されない。
【0067】
いくつかの実施形態では、複数の指示は固定長コーディングでコーディングされ得る。いくつかの代替的な実施形態では、複数の指示は単項コーディングでコーディングされ得る。いくつかの代替的な実施形態では、複数の指示は、切り捨て単項コーディングでコーディングされ得る。いくつかの代替的または追加的な実施形態では、複数の指示は、予測の方法でコーディングされ得る。いくつかの実施形態では、複数の指示は、それぞれ、複数セットのSLP内で示され得る。
【0068】
いくつかの実施形態では、複数セットのSLPは、点群シーケンスをコーディングするための第1構文構造内のパラメータを含み得る。ビットストリーム内で点群シーケンスをコーディングするための第2構文構造内のパラメータを示すかどうかに関する情報、又は、ビットストリーム内で第2構文構造内のパラメータをどのように示すかに関する情報のうちの少なくとも1つは第1構文構造内のパラメータに依存し得る。第2構文構造のタイプは第1構文構造のタイプと異なる可能性がある。例えば、第1構文構造はSPSを含み得る。第2構文構造はGPS又はAPSを含み得る。
【0069】
いくつかの実施形態では、第1構文構造内のパラメータは、第2構文構造内のパラメータの前にシグナリングされ得る。一例として、SPS内のパラメータは、GPS又はAPS内のパラメータの前にシグナリングされ得る。
【0070】
いくつかの実施形態では、第2構文構造内のパラメータはビットストリームに存在しないことがあり、第1構文構造内のパラメータは第2構文構造に使用されることがある。一例では、第1構文構造内のパラメータが第2構文構造に使用されることが示される場合に、第2構文構造内のパラメータはシグナリングされなくてもよい。別の例では、第2構文構造内のパラメータがシグナリングされない場合に、第1構文構造内でシグナリングされたパラメータは第2構文構造に使用され得る。
【0071】
いくつかの実施形態では、第2構文構造内のパラメータは、ビットストリーム内で述語的に示され得る。一例では、第2構文構造内のパラメータは第1構文構造内のパラメータに基づいて決定され得る。いくつかの実施形態では、第1構文構造はSPSであり得、複数セットのSLPは、GPS内のパラメータ及びAPS内のパラメータをさらに含み得る。いくつかの実施形態では、第1構文構造内のパラメータは、第2構文構造内のパラメータの前にコーディングされ得る。
【0072】
いくつかの実施形態では、複数セットのSLPは、点群シーケンスをコーディングするための複数のパラメータセットを含み得る。例えば、複数のパラメータセットは、SPS、GPS、又はAPSのうちの少なくとも1つを含み得る。
【0073】
いくつかの実施形態では、点群シーケンス内の点群サンプルのデータユニットをコーディングするためのパラメータセットは、活性化関数によって複数のパラメータセットから取得され得る。データユニットは点群サンプルのジオメトリ・データ及び/又は点群サンプルの属性データを含み得る。
【0074】
いくつかの実施形態では、複数のパラメータセットを指す複数のパラメータセット指示は、第2レベルでビットストリーム内に示され得る。当該第2レベルはシーケンスレベルよりも低い。
【0075】
いくつかの実施形態では、複数のパラメータセットを指す複数のパラメータセット指示が第2レベルでビットストリーム内に示されるか否かに関する情報は、シーケンスレベルでのパラメータセットの数に依存し得る。当該第2レベルはシーケンスレベルよりも低い。例えば、シーケンスレベルで複数のパラメータセットが存在する場合に、複数のパラメータセット指示は、第2レベルでビットストリーム内に示され得る。一例では、複数のパラメータセット指示は、第2レベルで使用されるパラメータセットを示すインデックスを含み得る。
【0076】
いくつかの実施形態では、複数のパラメータセット指示は、固定長コーディングでコーディングされ得る。いくつかの代替的な実施形態では、複数のパラメータセット指示は、単項コーディングでコーディングされ得る。いくつかの代替的な実施形態では、複数のパラメータセット指示は、切り捨て単項コーディングでコーディングされ得る。いくつかの代替的または追加的な実施形態では、複数のパラメータセット指示は、予測の方法でコーディングされ得る。
【0077】
いくつかの実施形態では、複数のパラメータセット指示の1つは、第2レベルのヘッダボックス内で示され得る。一例では、複数のパラメータセット指示は、ジオメトリ・データユニットヘッダ(GSH)内で示され得る。別の例では、複数のパラメータセット指示は、属性データユニットヘッダ(ASH)内で示され得る。上記の例は、単に説明を目的として記載されたものであること理解すべきである。本開示の範囲は、これに限定されない。いくつかの代替的な実施形態では、複数のパラメータセット指示の1つは、点群サンプルのための情報ユニット内の構成ボックス内で示され得る。
【0078】
いくつかの実施形態では、データユニットは、シーケンスレベルよりも低い第2レベルで関連付けられ得る。即ち、活性化関数は、現在の第2レベルのためのパラメータセットを取得するために使用され得る。
【0079】
いくつかの実施形態では、第2レベルは、複数のパラメータセットの少なくとも1つが割り当てられ得る。いくつかの実施形態では、第2レベルのためのパラメータセットを指す指示は、第2レベルのヘッドボックス内で示され得、当該指示は、活性化関数によってパラメータセットを取得するために使用され得る。
【0080】
いくつかの実施形態では、データユニットはジオメトリ・データユニットであり得、ジオメトリ・データユニットについて活性化関数によって取得されたSPSは、他のデータユニットに使用され得る。
【0081】
いくつかの実施形態では、点群シーケンスのビットストリームは、非一時的なコンピュータ可読記録媒体に格納され得る。点群シーケンスのビットストリームは、点群処理装置によって実行される方法で生成されることができる。当該方法によれば、ビットストリームは、点群シーケンスをコーディングするための複数セットのSLPに基づいて生成される。複数セットのSLPは、ビットストリーム内で示される。
【0082】
いくつかの実施形態では、点群シーケンスのビットストリームは、点群シーケンスをコーディングするための複数セットのSLPに基づいて生成される。複数セットのSLPは、ビットストリーム内で示される。ビットストリームは、非一時的なコンピュータ可読記録媒体に格納され得る。
【0083】
本開示の実施形態は、以下の条項を考慮して説明することができ、その特徴は任意の合理的な態様で組み合わせることができる。
【0084】
条項1.点群コーディング方法であって、点群シーケンスをコーディングするための複数セットのシーケンスレベル・パラメータ(SLP)に基づいて、点群シーケンスと前記点群シーケンスのビットストリームとの間の変換を実行するステップを含み、前記複数セットのSLPは、ビットストリーム内で示される、方法。
【0085】
条項2.前記複数セットのSLPを指す複数の指示は、前記ビットストリーム内で示される、条項1に記載の方法。
【0086】
条項3.前記複数の指示は、前記複数セットのSLPの少なくとも1セットのSLPを示す少なくとも1つのインデックスを含む、条項2に記載の方法。
【0087】
条項4.前記少なくとも1つのインデックスには、所定の番号から始まる番号が付けられる、条項3に記載の方法。
【0088】
条項5.前記所定の番号は0である、条項4に記載の方法。
【0089】
条項6.前記複数の指示は、固定長コーディング、単項コーディング、又は切り捨て単項コーディングのうちの1つでコーディングされる、条項2~5のいずれか1項に記載の方法。
【0090】
条項7.前記複数の指示は、予測的にコーディングされる、条項2~5のいずれか1項に記載の方法。
【0091】
条項8.前記複数の指示は、それぞれ、前記複数セットのSLP内で示される、条項2~7のいずれか1項に記載の方法。
【0092】
条項9.前記複数セットのSLPは、前記点群シーケンスをコーディングするための第1構文構造内のパラメータを含み、前記ビットストリーム内で前記点群シーケンスをコーディングするための第2構文構造内のパラメータを示すかどうかに関する情報、又は、前記ビットストリーム内で前記第2構文構造内の前記パラメータをどのように示すかに関する情報のうちの少なくとも1つは、前記第1構文構造内の前記パラメータに依存し、前記第2構文構造のタイプは、前記第1構文構造のタイプと異なる、条項1~8のいずれか1項に記載の方法に記載の方法。
【0093】
条項10.前記第1構文構造は、シーケンスパラメータセット(SPS)を含む、条項9に記載の方法。
【0094】
条項11.前記第2構文構造は、ジオメトリ・パラメータセット(GPS)又は属性パラメータセット(APS)を含む、条項9又は10に記載の方法。
【0095】
条項12.前記第1構文構造内の前記パラメータは、前記第2構文構造内の前記パラメータの前にシグナリングされる、条項9~11のいずれか1項に記載の方法。
【0096】
条項13.前記第2構文構造内の前記パラメータは前記ビットストリームに存在せず、前記第1構文構造内の前記パラメータは前記第2構文構造に使用される、条項9~11のいずれか1項に記載の方法。
【0097】
条項14.前記第2構文構造内の前記パラメータは、前記ビットストリーム内で述語的に示される、条項9~12のいずれか1項に記載の方法。
【0098】
条項15.前記第2構文構造内の前記パラメータは、前記第1構文構造内の前記パラメータに基づいて決定される、条項9~12のいずれか1項に記載の方法。
【0099】
条項16.前記第1構文構造はSPSであり、前記複数セットのSLPはGPS内のパラメータ及びAPS内のパラメータをさらに含む、条項9~12のいずれか1項に記載の方法。
【0100】
条項17.前記第1構文構造内の前記パラメータは、前記第2構文構造内の前記パラメータの前にコーディングされる、条項9~12のいずれか1項に記載の方法。
【0101】
条項18.前記複数セットのSLPは、点群シーケンスをコーディングするための複数のパラメータセットを含む、条項1~17のいずれか1項に記載の方法。
【0102】
条項19.前記複数のパラメータセットは、SPS、GPS、又はAPSのうちの少なくとも1つを含む、条項18に記載の方法。
【0103】
条項20.前記点群シーケンス内の点群サンプルのデータユニットをコーディングするためのパラメータセットは、活性化関数によって前記複数のパラメータセットから取得される、条項18又は19に記載の方法。
【0104】
条項21.前記データユニットは、前記点群サンプルのジオメトリ・データ、又は前記点群サンプルの属性データのうちの少なくとも1つを含む、条項20に記載の方法。
【0105】
条項22.前記複数のパラメータセットを指す複数のパラメータセット指示は、第2レベルで前記ビットストリーム内に示され、前記第2レベルは、シーケンスレベルよりも低い、条項18~21のいずれか1項に記載の方法。
【0106】
条項23.前記複数のパラメータセットを指す複数のパラメータセット指示が第2レベルで前記ビットストリーム内に示されるか否かに関する情報は、シーケンスレベルでのパラメータセットの数に依存し、前記第2レベルは、前記シーケンスレベルよりも低い、条項18~22のいずれか1項に記載の方法。
【0107】
条項24.前記複数のパラメータセット指示は、前記第2レベルで使用されるパラメータセットを示すインデックスを含む、条項22又は23に記載の方法。
【0108】
条項25.前記複数のパラメータセット指示は、固定長コーディング、単項コーディング、又は切り捨て単項コーディングのうちの1つでコーディングされる、条項22~24のいずれか1項に記載の方法。
【0109】
条項26.前記複数のパラメータセット指示は、予測の方法でコーディングされる、条項22~24のいずれか1項に記載の方法。
【0110】
条項27.前記複数のパラメータセット指示の1つは、前記第2レベルのヘッダボックス内で示される、条項22~24のいずれか1項に記載の方法。
【0111】
条項28.前記複数のパラメータセット指示の1つは、前記点群サンプルのための情報ユニット内の構成ボックス内で示される、条項22~24のいずれか1項に記載の方法。
【0112】
条項29.前記データユニットは、シーケンスレベルよりも低い第2レベルで関連付けられる、条項20又は21に記載の方法。
【0113】
条項30.前記第2レベルは、前記複数のパラメータセットの少なくとも1つが割り当てられる、条項29に記載の方法。
【0114】
条項31.前記第2レベルのためのパラメータセットを指す指示は、前記第2レベルのヘッドボックス内で示され、前記指示は、前記パラメータセットを取得するために前記活性化関数によって使用される、条項29に記載の方法。
【0115】
条項32.前記データユニットはジオメトリ・データユニットであり、前記ジオメトリ・データユニットについて前記活性化関数によって取得されたSPSは他のデータユニットに使用される、条項29に記載の方法。
【0116】
条項33.前記変換は、前記点群シーケンスを前記ビットストリームに符号化するステップを含む、条項1~32のいずれか1項に記載の方法。
【0117】
条項34.前記変換は、前記ビットストリームから前記点群シーケンスを復号するステップを含む、条項1~32のいずれか1項に記載の方法。
【0118】
条項35.プロセッサと命令を備える非一時的なメモリとを含む、点群データを処理する装置であって、前記命令は、前記プロセッサによって実行されると、前記プロセッサに条項1~34のいずれか1項に記載の方法を実行させる、装置。
【0119】
条項36.プロセッサに条項1~34に記載の方法を実行させる命令を記憶する、非一時的なコンピュータ可読記憶媒体。
【0120】
条項37.点群処理装置によって実行される方法で生成される、点群シーケンスのビットストリームを記憶する非一時的なコンピュータ可読記録媒体であって、前記方法は、点群シーケンスをコーディングするための複数セットのシーケンスレベル・パラメータ(SLP)に基づいて、前記ビットストリームを生成するステップを含み、前記複数セットのSLPは、前記ビットストリーム内で示される、非一時的なコンピュータ可読記録媒体。
【0121】
条項38.点群シーケンスのビットストリームを記憶するための方法であって、点群シーケンスをコーディングするための複数セットのシーケンスレベル・パラメータ(SLP)に基づいて、前記ビットストリームを生成することと、前記ビットストリームを非一時的なコンピュータ可読記録媒体内に記憶することと、を含み、前記複数セットのSLPは、前記ビットストリームで示される、方法。
【0122】
例示的なデバイス
図10は、本開示の様々な実施形態を実施できるコンピューティングデバイス1000のブロック図を示す。コンピューティングデバイス1000は、ソースデバイス110(或いは、GPCCエンコーダ116又は200)又は宛先デバイス120(或いは、GPCCデコーダ126又は300)として実施されるか、又は、それに含まれ得る。
【0123】
図10に示されるコンピューティングデバイス1000は、単に説明を目的としたものであり、本開示の実施形態の機能及び範囲をいかなる態様でも制限することを示唆するものではないことが理解されるだろう。
【0124】
図10に示すように、コンピューティングデバイス1000は、汎用コンピューティングデバイス1000を含む。コンピューティングデバイス1000は、少なくとも1つ又は複数のプロセッサ又は処理ユニット1010と、メモリ1020と、記憶ユニット1030と、1つ又は複数の通信ユニット1040と、1つ又は複数の入力デバイス1050と、1つ又は複数の出力デバイス1060と、を含み得る。
【0125】
いくつかの実施形態では、コンピューティングデバイス1000は、コンピューティング能力を有する任意のユーザ端末又はサーバ端末として実施され得る。前記サーバ端末は、サービスプロバイダが提供するサーバや大規模コンピューティングデバイスなどであり得る。前記ユーザ端末は、例えば、携帯電話、ステーション、ユニット、デバイス、マルチメディアコンピュータ、マルチメディアタブレット、インターネットノード、コミュニケータ、デスクトップコンピュータ、ラップトップコンピュータ、ノートブックコンピュータ、ネットブックコンピュータ、タブレットコンピュータ、パーソナルコミュニケーションシステム(PCS)デバイス、パーソナルナビゲーションデバイス、携帯情報端末(PDA)、オーディオ/GPCCプレーヤー、デジタルカメラ/GPCCカメラ、測位デバイス、テレビ受信機、ラジオ放送受信機、電子ブックデバイス、ゲームデバイス、又は、それらの任意の組み合わせ(これらのデバイスのアクセサリ及び周辺機器、又は、それらの任意の組み合わせを含む)を含む、任意のタイプの移動端末、固定端末、又は、携帯端末であり得る。コンピューティングデバイス1000は、ユーザに対する任意のタイプのインターフェース(「ウェアラブル」回路など)をサポートできることが考えられる。
【0126】
処理ユニット1010は、物理又は仮想プロセッサであり、メモリ1020に格納されたプログラムに基づいて様々なプロセスを実施し得る。マルチプロセッサシステムでは、コンピューティングデバイス1000の並列処理能力を向上させるために、複数の処理ユニットが、コンピュータ実行可能命令を並列に実行する。処理ユニット1010は、中央処理ユニット(CPU)、マイクロプロセッサ、コントローラ、又はマイクロコントローラと呼ばれ得る。
【0127】
コンピューティングデバイス1000は、通常、様々なコンピュータ記憶媒体を含む。このような媒体は、揮発性及び不揮発性媒体、又は、取り外し可能及び取り外し不可能な媒体を含むが、これらに限定されない、コンピューティングデバイス1000によってアクセス可能な任意の媒体であり得る。メモリ1020は、揮発性メモリ(例えば、レジスタ、キャッシュ、ランダムアクセスメモリ(RAM))、不揮発性メモリ(例えば、読み取り専用メモリ(ROM)、電気的に消去可能なプログラム可能な読み取り専用メモリ(EEPROM)、フラッシュ メモリ)、又は、それらの任意の組み合わせであり得る。記憶ユニット1030は、任意の取り外し可能又は取り外し不可能な媒体であり、情報及び/又はデータを記憶するために使用でき、コンピューティングデバイス1000でアクセスできる、メモリ、フラッシュメモリドライブ、磁気ディスク、又は別の他の媒体などの機械可読媒体を含み得る。
【0128】
コンピューティングデバイス1000は、追加の取り外し可能/取り外し不可能、揮発性/不揮発性メモリ媒体をさらに含み得る。なお、
図10には示していないが、着脱可能な不揮発性磁気ディスクの読み書きを行う磁気ディスクドライブや、着脱可能な不揮発性光ディスクの読み書きを行う光ディスクドライブを提供することが可能である。このような場合、各ドライブは、1つ又は複数のデータ媒体インターフェースを介して、バス(図示せず)に接続され得る。
【0129】
通信ユニット1040は、通信媒体を介して、さらなるコンピューティングデバイスと通信する。さらに、コンピューティングデバイス1000内のコンポーネントの機能は、通信接続を介して通信できる単一のコンピューティングクラスタ又は複数のコンピューティングマシンによって実施することができる。したがって、コンピューティングデバイス1000は、1つ又は複数の他のサーバ、ネットワーク化されたパーソナルコンピュータ(PC)、又は、さらなる一般的なネットワークノードとの論理接続を使用して、ネットワーク化された環境で動作することができる。
【0130】
入力デバイス1050は、マウス、キーボード、トラッキングボール、音声入力デバイスなどの様々な入力デバイスのうちの1つ又は複数であり得る。出力デバイス1060は、ディスプレイ、スピーカ、プリンタなどの様々な出力デバイスのうちの1つ又は複数であり得る。通信ユニット1040によって、コンピューティングデバイス1000は、記憶デバイス及び表示デバイスなどの1つ又は複数の外部デバイス(図示せず)とさらに通信することができ、1つ又は複数のデバイスにより、ユーザがコンピューティングデバイス1000と対話可能にするか、又は、必要に応じて、任意のデバイス(ネットワークカード、モデムなど)により、コンピューティングデバイス1000が1つ又は複数の他のコンピューティングデバイスと通信可能にする。このような通信は、入出力(I/O)インターフェース(図示せず)を介して、実行できる。
【0131】
いくつかの実施形態では、単一のデバイスに統合される代わりに、コンピューティングデバイス1000のいくつかの又はすべてのコンポーネントが、クラウドコンピューティングアーキテクチャに配置され得る。クラウドコンピューティングアーキテクチャでは、コンポーネントは遠隔的に提供され、連携して本開示で説明される機能を実施し得る。いくつかの実施形態では、クラウドコンピューティングは、コンピューティング、ソフトウェア、データアクセス及びストレージサービスを提供し、これらのサービスを提供するシステム又はハードウェアの物理的な位置又は構成をエンドユーザが認識する必要はない。様々な実施形態において、クラウドコンピューティングは、適切なプロトコルを使用して、広域ネットワーク(インターネットなど)を介して、サービスを提供する。例えば、クラウドコンピューティングプロバイダーは、Webブラウザ又はその他のコンピューティングコンポーネントを通じてアクセスできる、広域ネットワーク経由でアプリケーションを提供する。クラウドコンピューティングアーキテクチャのソフトウェア又はコンポーネント及び対応するデータは、遠隔地にあるサーバに保存され得る。クラウドコンピューティング環境におけるコンピューティングリソースは、リモートデータセンターの場所に併合又は分散され得る。クラウドコンピューティングインフラストラクチャは、ユーザにとって単一のアクセスポイントとして動作するが、共有データセンターを通じて、サービスを提供し得る。したがって、クラウドコンピューティングアーキテクチャを使用して、本明細書で説明されるコンポーネント及び機能を、遠隔地にあるサービスプロバイダから提供し得る。代替形態として、それらは、従来のサーバから提供されるか、又は、クライアントデバイスに直接又はその他の方法でインストールされ得る。
【0132】
コンピューティングデバイス1000は、本開示の実施形態において、点群符号化/復号化を実施するために使用され得る。メモリ1020は、1つ又は複数のプログラム命令を有する1つ又は複数の点群コーディングモジュール1025を含み得る。これらのモジュールは、本明細書で説明される様々な実施形態の機能を実行するように、処理ユニット1010によって、アクセス可能かつ実行可能である。
【0133】
点群符号化を実行する例示的な実施形態では、入力デバイス1050は、符号化される点群データを、入力1070として受信し得る。点群データは、例えば、点群コーディングモジュール1025によって処理されて、符号化されたビットストリームを生成し得る。符号化されたビットストリームは、出力デバイス1060を介して、出力1080として提供され得る。
【0134】
点群復号化を実行する例示的な実施形態では、入力デバイス1050は、符号化されたビットストリームを、入力1070として受信し得る。符号化されたビットストリームは、例えば、点群コーディングモジュール1025によって処理されて、復号された点群データを生成し得る。復号されたGPCCデータは、出力デバイス1060を介して、出力1080として提供され得る。
【0135】
本開示は、その好ましい実施形態を参照して、特に、図示及び説明されたが、添付の特許請求の範囲によって定義される本出願の精神及び範囲から逸脱することなく、形態及び詳細における様々な変更を行うことができることが当業者には理解されるであろう。このような変形は、本出願の範囲に含まれるものとする。したがって、本出願の実施形態に関する前述の説明は、限定することを意図したものではない。
【手続補正書】
【提出日】2024-05-20
【手続補正1】
【補正対象書類名】特許請求の範囲
【補正対象項目名】全文
【補正方法】変更
【補正の内容】
【特許請求の範囲】
【請求項1】
点群コーディング方法であって、
点群シーケンスをコーディングするための複数セットのシーケンスレベル・パラメータ(SLP)に基づいて、点群シーケンスと前記点群シーケンスのビットストリームとの間の変換を実行するステップを含み、
複数のSLPセットはビットストリーム内で示され、点群シーケンスをコーディングするための複数のパラメータセットを含み、点群シーケンス内の点群サンプルのデータユニットをコーディングするためのパラメータセットが、活性化関数によって複数のパラメータセットから取得される、
方法。
【請求項2】
前記複数セットのSLPは、前記点群シーケンスをコーディングするための第1構文構造内のパラメータを含み、
前記ビットストリーム内で前記点群シーケンスをコーディングするための第2構文構造内のパラメータを示すかどうかに関する情報、又は、前記ビットストリーム内で前記第2構文構造内の前記パラメータをどのように示すかに関する情報のうちの少なくとも1つは、前記第1構文構造内の前記パラメータに依存し、
前記第2構文構造のタイプは、前記第1構文構造のタイプと異なる、
請求項
1に記載の方法に記載の方法。
【請求項3】
前記第1構文構造は、シーケンス・パラメータセット(SPS)を含
み、または、
前記第2構文構造は、ジオメトリ・パラメータセット(GPS)又は属性パラメータセット(APS)を含む、
請求項
2に記載の方法。
【請求項4】
前記第1構文構造内の前記パラメータは、前記第2構文構造内の前記パラメータの前にシグナリングされる、
請求項
2~3のいずれか1項に記載の方法。
【請求項5】
前記第2構文構造内の前記パラメータは前記ビットストリームに存在せず、前記第1構文構造内の前記パラメータは前記第2構文構造に使用され
、または、
前記第2構文構造内の前記パラメータは、前記ビットストリーム内で予測的に示され、または
前記第2構文構造内の前記パラメータは、前記第1構文構造内の前記パラメータに基づいて決定され、または
前記第1構文構造はSPSであり、前記複数セットのSLPはGPS内のパラメータ及びAPS内のパラメータをさらに含み、または
前記第1構文構造内の前記パラメータは、前記第2構文構造内の前記パラメータの前にコーディングされる、
請求項
2~3のいずれか1項に記載の方法。
【請求項6】
前記複数のパラメータセットは、SPS、GPS、又はAPSのうちの少なくとも1つを含む、
請求項1
~3のいずれか1項に記載の方法。
【請求項7】
前記データユニットは、
前記点群サンプルのジオメトリデータ、又は、
前記点群サンプルの属性データのうちの少なくとも1つを含む、
請求項
1~3のいずれか1項に記載の方法。
【請求項8】
前記複数のパラメータセットを指す複数のパラメータセット指示は、第2レベルで前記ビットストリーム内に示され、
前記第2レベルは、シーケンスレベルよりも低
く、または
前記複数のパラメータセットを指す複数のパラメータセット指示が、第2レベルで前記ビットストリーム内に示されるか否かに関する情報は、シーケンスレベルでのパラメータセットの数に依存し、
前記第2レベルは、前記シーケンスレベルよりも低い、
請求項
1~3のいずれか1項に記載の方法。
【請求項9】
前記複数のパラメータセット指示は、前記第2レベルで使用されるパラメータセットを示すインデックスを含む、
請求項
8に記載の方法。
【請求項10】
前記複数のパラメータセット指示は、
固定長コーディング、
単項コーディング、又は
切り
捨て単項コーディングのうちの1つでコーディングされ
、または
前記複数のパラメータセット指示は、予測の方法でコーディングされる、
請求項
8項に記載の方法。
【請求項11】
前記複数のパラメータセット指示の1つは、前記第2レベルのヘッダボックス内で示される、
請求項
8項に記載の方法。
【請求項12】
前記複数のパラメータセット指示の1つは、前記点群サンプルの情報ユニット内の構成ボックス内で示される、
請求項
8項に記載の方法。
【請求項13】
前記データユニットは、シーケンスレベルよりも低い第2レベルで関連付けられる、
請求項1
~3のいずれか1項に記載の方法。
【請求項14】
前記第2レベルは、前記複数のパラメータセットのうちの少なくとも1つが割り当てられる、
請求項
13に記載の方法。
【請求項15】
前記第2レベルのパラメータセットを指す指示は、前記第2レベルのヘッドボックス内で示され、前記指示は、前記パラメータセットを取得するために前記活性化関数によって使用される、
請求項
13に記載の方法。
【請求項16】
前記データユニットはジオメトリ・データユニットであり、前記ジオメトリ・データユニットの前記活性化関数によって取得されたSPSは、他のデータユニットに使用される、請求項
13に記載の方法。
【請求項17】
前記変換は、前記点群シーケンスを前記ビットストリームに符号化するステップを含
み、または
前記変換は、前記ビットストリームから前記点群シーケンスを復号するステップを含む、
請求項1~
3のいずれか1項に記載の方法。
【請求項18】
プロセッサと命令を備える非一時的なメモリとを含む、点群データを処理する装置であって、
前記命令は、前記プロセッサによって実行されると、前記プロセッサに請求項1~
3のいずれか1項に記載の方法を実行させる、装置。
【請求項19】
プロセッサに請求項1~
3のいずれか1項に記載の方法を実行させる命令を記憶する、
非一時的なコンピュータ可読記憶媒体。
【請求項20】
点群シーケンスのビットストリームを記憶する方法であって、
点群シーケンスをコーディングするための複数セットのシーケンスレベル・パラメータ(SLP)に基づいて、前記ビットストリームを生成するステップ
であって、複数のセットのSLPはビットストリーム内で示され、点群シーケンスをコーディングするための複数のパラメータセットを含み、点群シーケンス内の点群サンプルのデータユニットをコーディングするためのパラメータセットが、活性化関数によって複数のパラメータセットから取得されるステップと、
前記ビットストリームを非一時的なコンピュータ可読記録媒体内に記憶するステップと、を含み、
前記複数セットのSLPは、前記ビットストリームで示される、方法。
【国際調査報告】