(19)【発行国】日本国特許庁(JP)
(12)【公報種別】特許公報(B2)
(11)【特許番号】
(24)【登録日】2023-12-21
(45)【発行日】2024-01-04
(54)【発明の名称】点群データ処理
(51)【国際特許分類】
H04N 21/84 20110101AFI20231222BHJP
H04N 21/234 20110101ALI20231222BHJP
H04N 21/235 20110101ALI20231222BHJP
G06T 9/00 20060101ALI20231222BHJP
【FI】
H04N21/84
H04N21/234
H04N21/235
G06T9/00
(21)【出願番号】P 2022542002
(86)(22)【出願日】2020-01-08
(86)【国際出願番号】 CN2020070854
(87)【国際公開番号】W WO2021093153
(87)【国際公開日】2021-05-20
【審査請求日】2022-08-19
(73)【特許権者】
【識別番号】511151662
【氏名又は名称】中興通訊股▲ふん▼有限公司
【氏名又は名称原語表記】ZTE CORPORATION
【住所又は居所原語表記】ZTE Plaza,Keji Road South,Hi-Tech Industrial Park,Nanshan Shenzhen,Guangdong 518057 China
(74)【代理人】
【識別番号】100078282
【氏名又は名称】山本 秀策
(74)【代理人】
【識別番号】100113413
【氏名又は名称】森下 夏樹
(74)【代理人】
【識別番号】100181674
【氏名又は名称】飯田 貴敏
(74)【代理人】
【識別番号】100181641
【氏名又は名称】石川 大輔
(74)【代理人】
【識別番号】230113332
【氏名又は名称】山本 健策
(72)【発明者】
【氏名】ファン, チェン
【審査官】醍醐 一貴
(56)【参考文献】
【文献】特表2022-524130(JP,A)
【文献】米国特許出願公開第2019/0104316(US,A1)
(58)【調査した分野】(Int.Cl.,DB名)
H04N 21/00-21/858
G06T 9/00-9/40
(57)【特許請求の範囲】
【請求項1】
点群データ処理の方法であって、
点群データの1つまたはそれを上回る3次元(3D)空間領域を記述する1つまたはそれを上回る空間領域記述子と、
前記点群データと関連付けられる点群コンポーネントを記述する1つまたはそれを上回る事前選択要素とを決定することと、
前記1つまたはそれを上回る空間領域記述子と、
前記1つまたはそれを上回る事前選択要素とを含むメディアプレゼンテーション記述(MPD)ファイルを伝送することと
を含む、方法。
【請求項2】
点群データ処理の方法であって、
点群データの1つまたはそれを上回る3次元(3D)空間領域を記述する1つまたはそれを上回る空間領域記述子と、前記点群データと関連付けられる点群コンポーネントを記述する1つまたはそれを上回る事前選択要素とを含むメディアプレゼンテーション記述(MPD)ファイルを受信することと、
1つまたはそれを上回る事前選択要素の事前選択を伴って、前記点群データの前記1つまたはそれを上回る3D空間領域に対応する前記点群コンポーネントにアクセスすることと
を含む、方法。
【請求項3】
前記1つまたはそれを上回る空間領域記述子は、前記MPDファイル内の前記点群データのためのメイン適合セット内に含まれる、請求項1または2に記載の方法。
【請求項4】
前記1つまたはそれを上回る空間領域記述子はそれぞれ、前記1つまたはそれを上回る3D空間領域のオフセット値と、寸法とを含む、請求項1または2に記載の方法。
【請求項5】
前記1つまたはそれを上回る空間領域記述子はそれぞれ、前記点群データの3D境界ボックス情報を含む、請求項1または2に記載の方法。
【請求項6】
前記1つまたはそれを上回る事前選択要素は、前記点群データの1つまたはそれを上回るエンコードバージョンと関連付けられ、
前記1つまたはそれを上回る事前選択要素はそれぞれ、前記点群データを識別する第1の値と、前記1つまたはそれを上回る3D空間領域を識別する第2の値とを含む、
請求項1または2に記載の方法。
【請求項7】
前記1つまたはそれを上回る事前選択要素はそれぞれ、前記第1の値と、前記第2の値とを含む点群記述子要素を含む、請求項6に記載の方法。
【請求項8】
前記1つまたはそれを上回る事前選択要素はそれぞれ、
前記点群データのためのメイン適合セットの識別子と、
前記点群コンポーネントに対応する適合セットの複数の識別子と
を含む、請求項1または2に記載の方法。
【請求項9】
前記1つまたはそれを上回る事前選択要素はそれぞれ、前記識別子と、前記複数の識別子とを含む事前選択コンポーネント属性を含む、請求項8に記載の方法。
【請求項10】
前記点群コンポーネントは、アトラスデータ、占有率マップコンポーネント、幾何学的コンポーネント、または属性コンポーネントを含む、請求項1~9のいずれかに記載の方法。
【請求項11】
前記点群コンポーネントは、前記点群データの前記1つまたはそれを上回る3D空間領域に対応する、請求項1~9のいずれかに記載の方法。
【請求項12】
請求項1~11の
いずれかに記載の方法を実装するように構成されるプロセッサを備える、ビデオ処理装置。
【請求項13】
非一過性のコンピュータ可読プログラム記憶媒体であって、前記非一過性のコンピュータ可読プログラム記憶媒体は、その上に記憶されるコードを有し、前記コードは、プロセッサによって実行されると、前記プロセッサに、請求項1~11の
いずれかに記載の方法を実装させる、非一過性のコンピュータ可読プログラム記憶媒体。
【発明の詳細な説明】
【技術分野】
【0001】
本特許文書は、マルチメディアデータ処理および伝送技術、および/または点群データ処理および伝送の方法、装置、およびシステムを対象とする。
【背景技術】
【0002】
ビデオエンコーディングは、圧縮ツールを使用し、2次元のビデオフレームを、ネットワークを経由して記憶または運搬するためにより効率的である、圧縮されたビットストリーム表現の中にエンコードする。エンコーディングのために2次元のビデオフレームを使用する、従来的なビデオコーディング技法は、時として、3次元の視覚場面の視覚情報の表現に関して非効率的である。
【発明の概要】
【課題を解決するための手段】
【0003】
本特許文書は、とりわけ、多次元点群に関連する、視覚情報を搬送する、デジタルビデオをエンコードおよびデコードするための技法を説明する。
【0004】
点群データの1つまたはそれを上回る3次元(3D)空間領域を記述する、1つまたはそれを上回る空間領域記述子と、点群データと関連付けられる点群コンポーネントを記述する、1つまたはそれを上回る事前選択要素とを決定するステップと、1つまたはそれを上回る空間領域記述子と、1つまたはそれを上回る事前選択要素とを含む、メディアプレゼンテーション記述(MPD)ファイルを伝送するステップとを含む。
【0005】
点群データ処理の別の方法は、点群データの1つまたはそれを上回る3次元(3D)空間領域を記述する、1つまたはそれを上回る空間領域記述子と、その点群データと関連付けられる点群コンポーネントを記述する、1つまたはそれを上回る事前選択要素とを含む、メディアプレゼンテーション記述(MPD)ファイルを受信するステップと、1つまたはそれを上回る事前選択要素の事前選択を伴って、点群データの1つまたはそれを上回る3D空間領域に対応する、点群コンポーネントにアクセスするステップとを含む。
【0006】
さらに別の例示的側面では、上記に説明される方法および本特許文書内で説明される方法は、プロセッサ実行可能コードの形態で具現化され、非一過性のコンピュータ可読記憶媒体内に記憶される。コンピュータ可読記憶媒体内に含まれるコードは、プロセッサによって実行されると、プロセッサに、本特許文書内で説明される方法を実装させる。
【0007】
別の例示的実施形態は、上記に説明される方法および本特許文書内で説明される方法を実施するように構成される、または動作可能である、デバイスを開示する。
【0008】
上記および他の側面、およびそれらの実装は、図面、明細書、および請求項において、より詳細に説明される。
例えば、本願は以下の項目を提供する。
(項目1)
点群データ処理の方法であって、
点群データの1つまたはそれを上回る3次元(3D)空間領域を記述する1つまたはそれを上回る空間領域記述子と、点群データと関連付けられる点群コンポーネントを記述する1つまたはそれを上回る事前選択要素とを決定することと、
1つまたはそれを上回る空間領域記述子と、1つまたはそれを上回る事前選択要素とを含むメディアプレゼンテーション記述(MPD)ファイルを伝送することと
を含む、方法。
(項目2)
上記1つまたはそれを上回る空間領域記述子は、上記MPDファイル内の上記点群データのためのメイン適合セット内に含められる、項目1に記載の方法。
(項目3)
上記1つまたはそれを上回る空間領域記述子はそれぞれ、上記1つまたはそれを上回る3D空間領域のオフセット値と、寸法とを含む、項目1に記載の方法。
(項目4)
上記1つまたはそれを上回る空間領域記述子はそれぞれ、上記点群データの3D境界ボックス情報を含む、項目1に記載の方法。
(項目5)
上記1つまたはそれを上回る事前選択要素は、上記点群データの1つまたはそれを上回るエンコードバージョンと関連付けられ、
上記1つまたはそれを上回る事前選択要素はそれぞれ、上記点群データを識別する第1の値と、上記1つまたはそれを上回る3D空間領域を識別する第2の値とを含む、
項目1に記載の方法。
(項目6)
上記1つまたはそれを上回る事前選択要素はそれぞれ、上記第1の値と、上記第2の値とを含む点群記述子要素を含む、項目5に記載の方法。
(項目7)
上記1つまたはそれを上回る事前選択要素はそれぞれ、
上記点群データのためのメイン適合セットの識別子と、
上記点群コンポーネントに対応する適合セットの複数の識別子と
を含む、項目1に記載の方法。
(項目8)
点群コンポーネントトラックグループ識別子属性が、上記1つまたはそれを上回る空間領域記述子に存在しない、項目7に記載の方法。
(項目9)
上記1つまたはそれを上回る事前選択要素はそれぞれ、
上記点群データのためのメイン適合セットの識別子と、
点群コンポーネントに対応するコンテンツコンポーネントの複数の識別子と
を含む、項目1に記載の方法。
(項目10)
点群コンポーネントトラックグループ識別子が、上記1つまたはそれを上回る空間領域記述子内に存在する、項目9に記載の方法。
(項目11)
上記1つまたはそれを上回る事前選択要素はそれぞれ、上記識別子と、上記複数の識別子とを含む事前選択コンポーネント属性を含む、項目7または9に記載の方法。
(項目12)
上記1つまたはそれを上回る空間領域記述子内の点群コンポーネントトラックグループ識別子属性は、異なる適合セットからコンテンツコンポーネントにマッピングされる1つの3D空間領域に対応する、項目1に記載の方法。
(項目13)
上記点群コンポーネントは、アトラスデータ、占有率マップコンポーネント、幾何学的コンポーネント、または属性コンポーネントを含む、項目1-12のいずれかに記載の方法。
(項目14)
上記点群コンポーネントは、上記点群データの上記1つまたはそれを上回る3D空間領域に対応する、項目1-12のいずれかに記載の方法。
(項目15)
点群データ処理の方法であって、
点群データの1つまたはそれを上回る3次元(3D)空間領域を記述する1つまたはそれを上回る空間領域記述子と、上記点群データと関連付けられる点群コンポーネントを記述する1つまたはそれを上回る事前選択要素とを含むメディアプレゼンテーション記述(MPD)ファイルを受信することと、
1つまたはそれを上回る事前選択要素の事前選択を伴って、上記点群データの上記1つまたはそれを上回る3D空間領域に対応する上記点群コンポーネントにアクセスすることと
を含む、方法。
(項目16)
上記1つまたはそれを上回る空間領域記述子は、上記MPDファイル内の上記点群データのためのメイン適合セット内に含まれる、項目15に記載の方法。
(項目17)
上記1つまたはそれを上回る空間領域記述子はそれぞれ、上記1つまたはそれを上回る3D空間領域のオフセット値と、寸法とを含む、項目15に記載の方法。
(項目18)
上記1つまたはそれを上回る空間領域記述子はそれぞれ、上記点群データの3D境界ボックス情報を含む、項目15に記載の方法。
(項目19)
上記1つまたはそれを上回る事前選択要素は、上記点群データの1つまたはそれを上回るエンコードバージョンと関連付けられ、
上記1つまたはそれを上回る事前選択要素はそれぞれ、上記点群データを識別する第1の値と、上記1つまたはそれを上回る3D空間領域を識別する第2の値とを含む、
項目15に記載の方法。
(項目20)
上記1つまたはそれを上回る事前選択要素はそれぞれ、上記第1の値と、上記第2の値とを含む点群記述子要素を含む、項目19に記載の方法。
(項目21)
上記1つまたはそれを上回る事前選択要素はそれぞれ、
上記点群データのためのメイン適合セットの識別子と、
上記点群コンポーネントに対応する適合セットの複数の識別子と
を含む、項目15に記載の方法。
(項目22)
点群コンポーネントトラックグループ識別子属性が、上記1つまたはそれを上回る空間領域記述子内に存在しない、項目21に記載の方法。
(項目23)
上記1つまたはそれを上回る事前選択要素はそれぞれ、
上記点群データのためのメイン適合セットの識別子と、
点群コンポーネントに対応するコンテンツコンポーネントの複数の識別子と
を含む、項目15に記載の方法。
(項目24)
点群コンポーネントトラックグループ識別子が、上記1つまたはそれを上回る空間領域記述子内に存在する、項目23に記載の方法。
(項目25)
上記1つまたはそれを上回る事前選択要素はそれぞれ、上記識別子と、上記複数の識別子とを含む事前選択コンポーネント属性を含む、項目21または23に記載の方法。
(項目26)
上記1つまたはそれを上回る空間領域記述子内の点群コンポーネントトラックグループ識別子属性は、異なる適合セットからコンテンツコンポーネントにマッピングされる1つの3D空間領域に対応する、項目15に記載の方法。
(項目27)
上記点群コンポーネントは、アトラスデータ、占有率マップコンポーネント、幾何学的コンポーネント、または属性コンポーネントを含む、項目15-26のいずれかに記載の方法。
(項目28)
上記点群コンポーネントは、上記点群データの上記1つまたはそれを上回る3D空間領域に対応する、項目15-26のいずれかに記載の方法。
(項目29)
項目1-28のうち1つまたはそれを上回るもの内に列挙される方法を実装するように構成されるプロセッサを備える、ビデオ処理装置。
(項目30)
非一過性のコンピュータ可読プログラム記憶媒体であって、上記非一過性のコンピュータ可読プログラム記憶媒体は、その上に記憶されるコードを有し、上記コードは、プロセッサによって実行されると、上記プロセッサに、項目1-28のうち1つまたはそれを上回るもの内に列挙される方法を実装させる、非一過性のコンピュータ可読プログラム記憶媒体。
【図面の簡単な説明】
【0009】
【
図1】
図1は、コンポーネント適合セットを使用して、点群コンテンツの3D空間領域に属する、ビデオベース点群圧縮(V-PCC)コンポーネントをグループ化するための例示的MPEG-DASH構成を図示する。
【0010】
【
図2】
図2は、点群コンテンツの3D空間領域に属する、V-PCCコンポーネントの事前選択のための例示的MPEG-DASH構成を図示する。
【0011】
【
図3】
図3は、点群の2つの3D空間領域に属する、V-PCCコンポーネントの事前選択のための例示的MPEG-DASH構成を図示する。
【0012】
【
図4A】
図4Aは、点群データ処理および伝送の例示的方法のフローチャートである。
【0013】
【
図4B】
図4Bは、点群データ処理の受信および処理の例示的方法のフローチャートである。
【0014】
【
図5】
図5は、ビデオエンコーダまたはビデオデコーダの一部であり得る、ハードウエアプラットフォーム500の例示的ブロック図を示す。
【発明を実施するための形態】
【0015】
ビデオベース点群圧縮(V-PCC)は、点群視覚情報のボリュームエンコーディングを表し、AVC、HEVC、およびVVC等のMPEG映像コーデックを利用することによって、点群データの効率的な、捕捉、圧縮、再構築、およびレンダリングを可能にする。コード化点群シーケンス(CPCS)を含有する、V-PCCビットストリームは、シーケンスパラメータセット(SPS)データ、アトラス情報ビットストリーム、2Dビデオエンコード占有率マップビットストリーム、2Dビデオエンコード幾何学形状ビットストリーム、およびゼロまたはそれを上回る2Dビデオエンコード属性ビットストリームを搬送する、VPCCユニットから成る。各V-PCCユニットは、V-PCCユニットヘッダを有し、これは、V-PCCユニットのタイプおよびV-PCCユニットペイロードを記述する。占有率、幾何学形状、および属性V-PCCユニットのペイロードは、対応する占有率、幾何学形状、および属性パラメータセットV-PCCユニット内で規定される、ビデオデコーダによって、デコードされ得る、ビデオデータユニット(例えば、HEVC NALユニット)に対応する。
【0016】
本特許文書は、空間領域記述子および関連事前選択機構の使用のために、実施形態2-5においてさらに説明されるように、点群コンテンツの3D空間領域に属する、V-PCCコンポーネントをグループ化するための技法を説明する。本特許文書内でさらに説明されるように、説明される技法は、点群データの部分的なアクセスおよび送達を促進するために使用されることができる。
【0017】
I.V-PCC International Organization for Standardization Base Media File Format(ISOBMFF)コンテナの例示的構造
【0018】
V-PCC基本ストリーム内のV-PCCユニットが、それらのタイプに基づいて、ISOBMFFファイル内の個々のトラックにマッピングされる。マルチトラックISOBMFF V-PCCコンテナには、2つのタイプのトラック、すなわち、V-PCCトラックおよびV-PCCコンポーネントトラックが、存在する。
【0019】
V-PCCトラックは、V-PCCビットストリーム内で、ボリューム視覚情報を搬送する、トラックであり、パッチ情報サブビットストリームと、シーケンスパラメータセットとを含む。V-PCCコンポーネントトラックは、制限付きビデオスキームトラックであり、V-PCCビットストリームの占有率マップサブビットストリーム、幾何学形状サブビットストリーム、および属性サブビットストリームのための2Dビデオエンコードデータを搬送する。本レイアウトに基づいて、V-PCC ISOBMFFコンテナは、以下を含み得る。
・(サンプルエントリ内の)シーケンスパラメータセットと、シーケンスパラメータセットV-PCCユニット(ユニットタイプVPCC_VPS)およびアトラスV-PCCユニット(ユニットタイプVPCC_AD)のペイロードを搬送する、サンプルとを含有する、V-PCCトラック。本トラックはまた、ビデオ圧縮V-PCCユニット(すなわち、ユニットタイプVPCC_OVD、VPCC_GVD、およびVPCC_AVD)のペイロードを搬送する、他のトラックへのトラック参照も含む。
・サンプルが、占有率マップデータのためのビデオコード化基本ストリームのアクセスユニット(例えば、タイプVPCC_OVDのV-PCCユニットのペイロード)を含有する、制限付きビデオスキームトラック。
・サンプルが、幾何学形状データのためのビデオコード化基本ストリームのアクセスユニット(例えば、タイプVPCC_GVDのV-PCCユニットのペイロード)を含有する、1つまたはそれを上回る制限付きビデオスキームトラック。
・サンプルが、属性データのためのビデオコード化基本ストリームのアクセスユニット(例えば、タイプVPCC_AVDのV-PCCユニットのペイロード)を含有する、ゼロまたはそれを上回る制限付きビデオスキームトラック。
【0020】
II.MPEG-DASHにおけるカプセル化およびシグナリング
【0021】
点群データ等のボリューム視覚メディアは、6自由度(6DoF)没入型メディア体験を提供するために、牽引力を獲得している。MPEG DASH等の適応ストリーミングベースのコンテンツ配信技術は、点群データ伝送をサポートする必要がある。
【0022】
従来的なメディアコンテンツとは異なり、V-PCCメディアコンテンツとして規定される点群データは、V-PCC点群表現と関連付けられる、特定のタイプのアトラスデータ、占有率マップ、幾何学形状、または属性を含む、いくつかの異なるV-PCCコンポーネントから成る。幾何学形状および属性のV-PCCコンポーネントは、多層を有し得る。各V-PCCコンポーネント(および/または層)は、V-PCCビットストリームのサブストリームとして、別個にエンコードされる。幾何学形状、占有率マップ、および属性のV-PCCコンポーネントサブストリームは、従来のビデオエンコーダ(例えば、H.264/AVCまたはH.265/HEVC)を使用してエンコードされる。しかしながら、これらのサブストリームは、点群データを再構築し、レンダリングするために、アトラスサブストリームのパッチデータとともに、集合的にデコードされる必要がある。
【0023】
III.点群データの部分的なアクセスおよび送達
【0024】
ユーザは、典型的には、点群オブジェクトを視認するために、6DoFを有する。任意の所与の時点で、入手可能な点群オブジェクトのいくつかの部分のみが、ユーザの場所、ビューポート、視野等に応じて、ユーザにとって可視となるであろう。したがって、多くの用途に対して、点群データ全体が、同時に、送達、デコード、およびレンダリングされる必要はない。
【0025】
3D空間内の具体的領域への空間的アクセスを可能にするために、点群オブジェクトのための境界ボックスは、いくつかの3D空間領域に分割されてもよい。点群オブジェクトの同一の部分に属する点は、ともにグループ化され、個別の3D空間領域によって表されてもよい。結果として生じる3D空間領域のそれぞれ内の点の投影から結果として生じるパッチは、V-PCCトラックの2Dフレーム内にともに圧縮される。点群の境界ボックス内の3D空間領域は、1つまたはそれを上回るV-PCCコンポーネントトラックグループと関連付けられてもよい。
【0026】
点群オブジェクトの部分的なアクセスおよび送達をサポートするためには、1つまたはそれを上回る3D空間サブ領域を識別し、ユーザの6DoFビューポートと、1つまたはそれを上回る関連付けられたV-PCCコンポーネントトラックグループとを完全に網羅する必要がある。
【0027】
IV.簡潔な議論
【0028】
節の見出しは、可読性を改良するためだけに、本文書内で使用され、各節において開示される、実施形態および技法の範囲をその節のみに限定しない。いくつかの特徴は、H.264/AVCおよびH.265/HEVCおよびMPEG規格の実施例を使用して説明される。しかしながら、開示される技法の適用性は、H.264/AVCまたはH.265/HEVCシステムのみに限定されない。
【0029】
本文書では、種々の構文要素が、点群データ処理のために、異なる節内で開示される。しかしながら、同一の名称を伴う構文要素は、別様に記述されない限り、異なる節内で使用されるものと同一のフォーマットおよび構文を有するであろうことを理解されたい。さらに、異なる節の見出しの下、説明される、異なる構文要素および構造は、種々の実施形態内で、ともに組み合わされてもよい。加えて、具体的な構造が、実装実施例として説明されるが、構文構造の種々のエントリの順序は、本文書内で別様に記述されない限り、変更され得ることを理解されたい。
【0030】
一般に、本開示技法に基づく実施形態が、ビデオデータ処理のために使用され得る。いくつかの実施形態では、全方向性ビデオデータが、国際標準化機構(ISO)基本メディアファイルフォーマットに基づいて、ファイル内に記憶される。それらのうち、制限付きスキーム情報ボックス、トラック参照ボックス、およびトラックグループボックス等のISO基本メディアファイルフォーマットは、動作するためのISO/IEC JTC1/SC29/WG11 MPEG(Moving Picture Experts Group)MPEG-4. Part 12 ISO基本メディアファイルフォーマットを指し得る。
【0031】
ISO基本ファイルフォーマット内の全てのデータが、ボックス内にインストールされる。MPEG4(MP4)ファイルによって表される、ISO基本ファイルフォーマットは、いくつかのボックスから成り、そのそれぞれが、タイプと、長さとを有し、データオブジェクトとして見なされ得る。ボックスは、コンテナボックスと呼ばれる、別のボックスを含有することができる。MP4ファイルは、最初に、ファイルフォーマットのマークアップとして、1つのみの「ftyp」タイプのボックスを有し、そのファイルについてのある情報を含有するであろう。1つのみの「MOOV」タイプのボックス(ムービーボックス)が、存在するであろうし、これは、そのサブボックスが、そのメディアに関するメタデータ情報を含有する、コンテナボックスである。MP4ファイルのメディアデータは、「mdat」タイプのメディアボックス(メディアデータボックス)内に含まれ、これはまた、コンテナボックスでもあり、これは、(メディアデータが他のファイルを参照するときに)利用可能である場合とそうでない場合があり、メディアデータの構造は、メタデータから成る。
【0032】
時間指定メタデータトラックは、ISO基本メディアファイルフォーマット(ISOBMFF)内の機構であり、特定のサンプルと関連付けられる時間指定メタデータを確立する。時間指定メタデータは、メディアデータとの結合が少なく、通常、「説明的」である。
【0033】
本書では、いくつかの技術的ソリューションが、MP4またはISOBMFFフォーマット等の従来的な2Dビデオフォーマットと互換性がある、フォーマットの中へ、MPEGのV-PCCデータ等、点群データの3Dまたは空間領域の表現を可能にするために提供される。本提案ソリューションの1つの有利な側面は、新しい機能性の実装のために、従来的な2Dビデオ技法および構文を再利用することが可能であることである。
【0034】
V.実施形態1:ビデオベース点群データの搬送
【0035】
V.(a).空間領域情報の構造
【0036】
いくつかの実施形態では、点群データの空間領域情報は、以下のうち任意の1つまたはそれを上回るものを含む、またはそれを使用して説明される。すなわち、SpatialRegionInfoStruct()およびBoundingBoxInfoStruct()は、x、y、z座標オフセットと、3D空間領域の幅、高さ、および深度とを含む、点群データの空間領域情報と、そのソース境界ボックスとを提供する。
【0037】
【0038】
意味論実施例
【0039】
region_idは、点群データの3D空間領域の識別を規定する。
【0040】
reference_x、reference_y、およびreference_zはそれぞれ、デカルト座標における、点群データの3D空間部分に対応する空間領域のx、y、およびz座標値を規定する。
【0041】
delta_included_flagは、SpatialRegionInfoStruct()において、delta_x、delta_y、およびdelta_zが、空間領域を規定するために使用されるかどうかを示す。
【0042】
delta_x、delta_y、およびdelta_zはそれぞれ、x、y、およびz軸に沿って、デカルト座標における、3D空間領域の寸法を規定する。
【0043】
幅、高さ、および深度はそれぞれ、x、y、およびz軸に沿って、デカルト座標における、3D空間領域の幅、高さ、および深度を示す。
【0044】
3d_bounding_box_present_flagは、点群データの3D境界ボックスパラメータが存在するかどうかを示す。
【0045】
bounding_box_x、bounding_box_y、およびbounding_box_zはそれぞれ、原点(0,0,0)に対して、x、y、およびz軸に沿って、デカルト座標における、点群データの3D境界ボックスの拡張子を規定する。
【0046】
V.(b).ビデオエンコードV-PCCコンポーネントトラック
【0047】
プレーヤ側において点群を再構築することなく、属性トラック、幾何学形状トラック、または占有率マップトラックからのデコード済フレームを表示することは、意義がない場合があるため、制限付きビデオスキームタイプが、これらのビデオコード化トラックのために定義される。例えば、V-PCCコンポーネントビデオトラックは、制限付きビデオとしてファイル内に表され、それらの制限付きビデオサンプルエントリのRestrictedSchemeInfoBoxのSchemeTypeBoxのscheme_typeフィールド内の’pccv’によって識別され得る。VPCCUnitheaderBoxを含む、V-PCCコンポーネントビデオトラック内に、SchemeInformationBoxが、存在するべきである。
【0048】
V-PCCコンポーネントビデオトラックは、少なくとも、2Dビデオエンコード占有率マップトラックと、2Dビデオエンコード幾何学形状トラックと、ゼロまたはそれを上回る2Dビデオエンコード属性トラックとを含んでもよい。点群データの同一の空間領域に対応する、全てのV-PCCコンポーネントトラック(占有率マップトラック、幾何学形状トラック、および属性トラック)が、VPCCTrackGroupBox(‘pctg’)の具体的なタイプを全てのコンポーネントトラックに追加することによって、ISO/IEC 14496-12のトラックグループ化ツールを使用して、ともにグループ化され得る。V-PCCコンポーネントビデオトラック内のVPCCTrackGroupBoxの実施例が、随意の実装と併せて下記に説明される。
VPCCTrackGroupBox
ボックスタイプ:‘pctg’
コンテナ: TrackBox
必須: いいえ
数量: ゼロまたは1
【0049】
‘pctg’に等しいtrack_group_typeを伴う、TrackGroupTypeBoxは、V-PCCコンポーネントトラックグループを示す、VPCCTrackGroupBoxである。
【0050】
‘pctg’に等しいtrack_group_typeを伴う、TrackGroupTypeBox内のtrack_group_idの同一の値を有する、V-PCCコンポーネントトラックは、3D空間関係を伴う、同一のトラックグループに属する(例えば、点群データの同一の3D領域に対応する)。‘pctg’に等しいtrack_group_typeを伴う、TrackGroupTypeBox内のtrack_group_idは、点群データの空間領域の識別子として使用され得る。
【0051】
同一の空間領域に対応するV-PCCコンポーネントトラックは、track_group_type ‘pctg’のためのtrack_group_idの同一の値を有し、1つの空間領域からのトラックのtrack_group_idは、任意の他の空間領域からのトラックのtrack_group_idと異なる。
【0052】
【0053】
V-PCCコンポーネントビデオトラックは、‘pctg’に等しいtrack_group_typeを伴うTrackGroupTypeBox、すなわち、VPCCTrackGroupBoxを含んでもよい。
【0054】
いくつかの実施形態では、点群データの空間領域情報は、先に説明されたフォーマットに類似するフォーマットを含む、またはそれを使用して記述される(段落[0034]以降参照)。
【0055】
V.(c).V-PCCトラック
【0056】
従来的な平面2Dビデオ情報を記憶する、ビデオトラックとは異なり、V-PCCトラックは、3Dボリューム視覚情報を記憶するための新しいタイプのトラックである。
【0057】
以下は、V-PCCトラックサンプルエントリを説明する。
サンプルエントリタイプ:‘vpc1’、‘vpcg’
コンテナ:SampleDescriptionBox(‘stsd’)
必須:‘vpc1’または‘vpcg’サンプルエントリが必須である
数量:1つまたはそれを上回るサンプルエントリが存在し得る
【0058】
V-PCCトラックは、‘vpc1’または‘vpcg’のサンプルエントリタイプを用いて、VolumetricVisualSampleEntryを拡張する、VPCCSampleEntryを使用するべきである。
【0059】
VPCCボリュームサンプルエントリは、本明細書に説明されるように、VPCCDecoderConfigurationRecordを含む、VPCCConfigurationBoxを含有するするべきである。
【化3】
【0060】
【0061】
意味論実施例
【0062】
num_regionsは、点群データの3D領域の数を規定する。
【0063】
mapping_type[i]は、点群データのregion[i]のマッピングタイプを規定する。
【0064】
num_patches[i]は、点群データのregion[i]内のパッチの数を規定する。
【0065】
num_tiles[i]は、点群データのregion[i]内の2Dタイルの数を規定する。
【0066】
tile_track_group_id[i][j]は、点群データのregion[i]の2Dタイルトラックグループ識別のアレイを規定する。
【0067】
num_tile_groups[i]は、点群データのregion[i]内のタイルグループの数を規定する。
【0068】
tile_group_id[i][j]は、点群データのregion[i]のタイルグループ識別のアレイを規定する。
【0069】
num_track_groups[i]は、点群データのregion[i]内のV-PCCコンポーネントトラックグループの数を規定する。
【0070】
track_group_id[i][j]は、点群データのregion[i]のV-PCCコンポーネントトラックグループ識別のアレイを規定する。
【0071】
V.(d).V-PCC時間指定メタデータトラック
【0072】
V-PCC空間領域時間指定メタデータトラックは、経時的に著しく変化する、点群データの対応する空間領域情報を示す、‘cdsc’トラック参照タイプのTrackReferenceBoxを利用することによって、個別のV-PCCトラックにリンクされる。
【0073】
V-PCC時間指定メタデータトラックのサンプルエントリと、そのサンプルフォーマットとは、以下のように説明され得る。
【0074】
点群データの3D領域は、以下に説明される、VolumetricTileInfoBox()を使用して、点群データの3D領域を再構築するための、パッチデータ、2Dタイルデータ、またはタイルグループデータを含有し得る、点群トラックパッチフレームの1つまたはそれを上回る2D領域と関連付けられる。
【0075】
【0076】
サンプルフォーマット
【0077】
本サンプルエントリタイプ‘pcsr’のサンプル構文は、以下のように規定される。
【化6】
【0078】
VI.実施形態2:MPEG-DASHにおけるカプセル化およびシグナリング
【0079】
VI.(a).単一トラックDASHモード
【0080】
DASHにおける単一トラックモードは、V-PCC ISOBMFFファイルのストリーミングを可能にし、異なるビデオエンコードコンポーネントが、単一トラックとして記憶される。DASHにおける単一トラックモードは、1つまたはそれを上回るRepresentationを伴う、1つのAdaptationSetとして表されるべきである。単独のAdaptationSet内の表現は、対応するビデオエンコードコンポーネントに対して、同一のコーデックを使用するものとするが、あらゆるビデオコンポーネントに対して同一のコーデックを使用することを要求されない。
【0081】
VI.(b).マルチトラックモード
【0082】
各V-PCCコンポーネントは、MPEG-DASHマニフェストまたはMPEG-Dashメディアプレゼンテーション記述(MPD)ファイル内において、別個のAdaptationSetとして表されてもよい。アトラス情報のための付加的なAdaptationSetは、V-PCCコンテンツのためのメインAdaptationSetとしての役割を果たす。V-PCCコンポーネントが、多層を有する場合、各層は、別個のAdaptationSetを使用して、シグナリングされてもよい。
【0083】
メインAdaptationSetは、‘vpc1’に設定される、@コーデック属性を有する一方、V-PCCコンポーネントAdaptationSet、または@コーデックが、AdaptationSet要素に対してシグナリングされない場合、Representationに対する@コーデック属性は、コンポーネントをエンコードするために使用される、個別のコーデックに基づいて設定される。
【0084】
メインAdaptationSetは、適合セットレベルで、単一の初期化セグメントを含有してもよい。初期化セグメントは、V-PCCシーケンスパラメータセットだけではなく、コンポーネントサブストリームのための他のパラメータセットを含む、V-PCCデコーダを初期化するために必要とされる、全てのシーケンスパラメータセットを含有してもよい。
【0085】
メインAdaptationSetのRepresentationのためのメディアセグメントは、V-PCCトラックの1つまたはそれを上回るトラック断片を含有してもよい。コンポーネントAdaptationSetのRepresentationのためのメディアセグメントは、ファイルフォーマットレベルで、対応するコンポーネントトラックの1つまたはそれを上回るトラック断片を含有してもよい。
【0086】
VI.(c).V-PCC事前選択
【0087】
V-PCC事前選択は、点群コンポーネントに対応するAdaptationSetのIDによって追従される、点群のためのメインAdaptationSetのIDを含む、@preselectionComponents属性のための識別子(ID)リストを伴って、MPEG-DASH(ISO/IEC 23009-1)において定義されるように、PreSelection要素を使用して、MPD内で信号伝達される。PreSelectionのための@codecs属性は、PreSelectionメディアが、ビデオベース点群であることを示す、‘vpc1’に設定されてもよい。PreSelectionは、Period要素内のPreSelection要素、または適合セットレベルにおける事前選択記述子のいずれかを使用して、シグナリングされてもよい。
【0088】
VI.(d).VPCCSpatialRegion記述子
【0089】
点群の静的3D空間領域およびそれらの関連付けられるV-PCCコンポーネントトラックグループを識別するために、VPCCSpatialRegion記述子が使用されるものとする。VPCCSpatialRegionは、”urn:mpeg:mpegI:vpcc:2019:vpsr”と等しい、@schemeIdUri属性を伴う、SupplementalProperty記述子である。
【0090】
最大で1つのVPCCSpatialRegion記述子が、マルチ-トラックモードのための点群のメインAdaptationSetにおいて、または単一トラックモードのための点群のAdaptationSetにおいて、適合セットレベルで存在してもよい。
【0091】
点群の同一の3D空間領域に対応する、V-PCCコンポーネントAdaptationSetは、同一のコーデックを使用するものとする(例えば、占有率マップは、全てのコンポーネントAdaptationSetにおいて、同一のコーデックを有するものとする)が、あらゆる点群コンポーネントに対して同一のコーデックを使用することは要求されない(例えば、占有率マップは、1つのコーデック、AVCを使用し得るであろうし、幾何学形状は、第2のコーデック、HEVCによってエンコードされ得るであろう)。
【0092】
VPCCSpatialRegion記述子の@value属性は、存在しなくてもよい。VPCCSpatialRegion記述子は、表1に規定されるような要素および属性を含んでもよい。
【表1-1】
【表1-2】
【表1-3】
【0093】
VI.(e).V-PCC記述子
【0094】
”urn:mpeg:mpegI:vpcc:2019:vpc”と等しい、@schemeIdUri属性を伴うEssentialProperty要素は、VPCC記述子と称される。最大で1つのVPCC記述子が、点群のメインAdaptationSetに対して、適合セットレベルで存在してもよい。
【表2-1】
【表2-2】
【0095】
表1において上記に説明される、VPCCSpatialRegion記述子の要素および属性はまた、表3に規定されるように、VPCC記述子の一部であり得る。
【表3-1】
【表3-2】
【0096】
MPEG-DASHにおける点群コンテンツの部分的なアクセスおよび送達をサポートするために、VPCCSpatialRegion記述子、VPCC記述子、およびPreSelection要素を使用する関連事前選択機構の使用は、以下のように説明される。
【0097】
点群コンテンツのためのメインAdaptationSet内における、適合セットレベルのVPCCSpatialRegion記述子は、メインAdaptationSet内で搬送される、V-PCCトラック、およびそれらの個別のコンポーネントAdaptationSets内で搬送される、関連付けられたV-PCCコンポーネントトラックが、点群オブジェクトの1つまたはそれを上回る静的3D空間領域に対応することを示す。
【0098】
VPCCSpatialRegion記述子のspatialRegion要素は、空間領域のx、y、zオフセット、および3D空間における空間領域の幅、高さ、および深度、および随意に点群の3D境界ボックス情報を含む、点群の空間領域に関する情報を提供する。
【0099】
多数のバージョンの同一点群が、別個のPreSelectionを使用してシグナリングされ得る。点群の同一の3D空間領域の代替バージョンを表す、PreSelectionは、同一の@pcId値および同一の@regionIds値を伴う、VPCC記述子を含有してもよく、@pcId属性に割り当てられた値は、点群コンテンツを識別し、@regionIds属性の値は、点群の1つまたはそれを上回る3D空間領域を識別する。例えば、実施形態3および5で、例示的MPDファイルにおいて示されるように、2つの事前選択の@pcId属性に割り当てられた値は、同一であり、両方の事前選択が同一の点群コンテンツに属することを示し得る。
【0100】
@trackGroups属性が、VPCCSpatialRegion記述子内に存在しない場合、@preselectionComponents属性のためのIDリストを伴う、PreSelection要素は、点群コンポーネントに対応するAdaptationSetのIDによって追従される点群のためのメインAdaptationSetのIDを含んでもよく、これは、点群における3D空間領域に属するグループ化V-PCCコンポーネントをシグナリングするために使用される。
【0101】
いくつかのV-PCCコンポーネントトラックグループに対するtrack_group_idの値を含有する、@trackGroups属性が、VPCCSpatialResions記述子内に存在する場合、@preselectionComponents属性のためのIDリストを伴う、PreSelection要素は、点群コンポーネントに対応するContentComponentのIDによって追従される点群のためのメインAdaptationSetのIDを含んでもよく、これは、点群における3D空間領域に属するグループ化V-PCCコンポーネントをシグナリングするために使用される。
【0102】
いくつかの実施形態では、点群コンポーネントは、個別のコンポーネントAdaptationSetの単一のRepresentation内で送達され、ContentComoponent要素によって記述されてもよく、例えば、占有率マップ、幾何学形状、および属性コンポーネントAdaptationSetは、同一のコンポーネントタイプの多数のV-PCCコンポーネントトラックを含有してもよく、各V-PCCコンポーネントトラックは、ContentComoponentにマッピングされる。したがって、点群のための3D空間領域に対応する、(@trackGroups属性と同一のtrack_group_id値を有する)V-PCCコンポーネントトラックのグループは、異なるコンポーネントAdaptationSetから、ContentComoponent要素にマッピングされ得る。
【0103】
実施形態3-5はさらに、VPCCSpatialRegion記述子および関連事前選択機構の使用に関して、実施形態2で説明されるように、点群コンテンツの3D空間領域に属する、V-PCCコンポーネントをグループ化するための技法を説明する。
【0104】
VII.実施形態3
【0105】
V-PCC空間領域の事前選択
【0106】
図1は、コンポーネント適合セットを使用して、点群コンテンツの3D空間領域に属する、V-PCCコンポーネントをグループ化するための例示的MPEG-DASH構成を図示する。本実施形態では、V-PCCシーケンスは、占有率、幾何学形状、および属性のビデオコード化コンポーネント、およびアトラスのV-PCCコンポーネントから成る。
【0107】
ビデオコード化占有率、幾何学形状、および属性コンポーネントはそれぞれ、別個のAdaptationSetによってシグナリングされる。占有率、幾何学形状、および属性コンポーネントの各コンポーネントAdaptationSetは、対応する値に設定される、@component_type属性を伴う、VPCCComponent記述子を含む。
【0108】
アトラスサブビットストリームを含む、V-PCCトラックは、単一の表現を伴う、メインAdaptationSetによってシグナリングされる。メインAdaptationSet内で搬送される、V-PCCトラック、およびそれらの個別のコンポーネントAdaptationSets内で搬送される、関連付けられたV-PCCコンポーネントトラックは、点群オブジェクトにおける、3D空間領域「1」および領域「2」に対応するため、メインAdaptationSetはそれぞれ、3D空間領域の識別子に設定される、@regionId属性を伴う、2つのVPCCSpatialRegion記述子を有する。他の属性、例えば、VPCCSpatialRegion記述子の@reference_x,@reference_y,@reference_zおよび@delta_x,@delta_y,@delta_zは、デカルト座標における、点群データの3D空間部分に対応する、x、y、z座標オフセット、および3D空間領域の幅、高さ、および深度を含む、3D空間領域の空間領域情報を提供する。
【0109】
点群の3D空間領域「1」および領域「2」に属する、V-PCCコンポーネントは、MPD内で、2つのPreSelection要素を使用して、別個にグループ化される。空間領域「1」の事前選択のためのPreSelection要素の@preselectionComponents属性は、「1 2 4 6」として、idリストを含む。空間領域「2」の事前選択のためのPreSelection要素の@preselectionComponents属性は、idリスト「1 3 5 7」を含む。事前選択におけるID 1は、点群データのためのメイン適合セットの識別子に対応し、ID 2、4、6および3、5、7は、点群コンポーネントに対応する、適合セットの識別子に対応する。
【0110】
点群を識別するために使用される、必須@pcId属性以外に、各PreSelection要素のVPCC記述子はまた、点群の3D空間領域、すなわち、領域「1」および「2」をそれぞれ記述するための@regionIds属性を含有するものとする。
【0111】
これらのV-PCC適合セットが、少なくとも1つの事前選択において参照されることを示すために、@value属性を伴わない事前選択記述子は、各AdaptationSet内でシグナリングされる。
【0112】
本実施例において、V-PCC空間領域の事前選択をシグナリングする、例示的MPDファイルは、以下に説明される。
【化7-1】
【化7-2】
【化7-3】
【0113】
VIII.実施形態4
【0114】
V-PCCコンポーネントAdaptationSetを使用した、V-PCC空間領域の事前選択
【0115】
図2は、点群コンテンツの3D空間領域に属する、V-PCCコンポーネントの事前選択のための例示的MPEG-DASH構成を図示する。
【0116】
本実施形態では、V-PCCシーケンスは、占有率、幾何学形状、および属性のビデオコード化コンポーネント、およびアトラスのV-PCCコンポーネントから成る。
【0117】
ビデオコード化占有率、幾何学形状、および属性コンポーネントはそれぞれ、別個のAdaptationSetによってシグナリングされ得る。占有率、幾何学形状、および属性コンポーネントの各コンポーネントAdaptationSetは、対応する値に設定される、@component_type属性を伴う、VPCCComponent記述子を含む。
【0118】
アトラスサブビットストリームを含む、V-PCCトラックは、単一の表現を伴う、メインAdaptationSetによってシグナリングされる。メインAdaptationSet内で搬送される、V-PCCトラック、およびそれらの個別のコンポーネントAdaptationSets内で搬送される、関連付けられたV-PCCコンポーネントトラックは、点群オブジェクトにおける、3D空間領域「1」に対応するため、メインAdaptationSetは、点群コンテンツの3D空間領域の識別子に設定される、@regionId属性を伴う、VPCCSpatialRegion記述子を有する。VPCCSpatialRegion記述子の@reference_x,@reference_y,@reference_zおよび@delta_x,@delta_y,@delta_z等の他の属性は、デカルト座標における、点群データの3D空間部分に対応する、x、y、z座標オフセット、および3D空間領域の幅、高さ、および深度を含む、3D空間領域の空間領域情報を提供する。
【0119】
本実施形態では、track_group_idの値を含有する、@trackGroups属性は、VPCCSpatialRegion記述子内に存在しないが、3D空間領域「1」に対応する、V-PCCコンポーネントトラックが、トラックグループ「1」およびトラックグループ「2」に属する。トラックグループ「1」のV-PCC占有率、幾何学形状、および属性コンポーネントトラックはそれぞれ、コンポーネントAdaptationSet2、4、および6内で搬送される。トラックグループ「2」のV-PCC占有率、幾何学形状、および属性コンポーネントトラックはそれぞれ、コンポーネントAdaptationSet3、5、および7内で搬送される。
【0120】
点群の空間領域「1」に属する、V-PCCコンポーネントは、MPD内で、1つのPreSelection要素を使用して、ともにグループ化される。空間領域「1」の事前選択のためのPreSelection要素の@preselectionComponents属性は、「1 2 3 4 5 6 7」として、idリストを含む。事前選択におけるID 1は、点群データのためのメイン適合セットの識別子に対応し、ID 2-7は、点群コンポーネントの識別子に対応する。PreSelection要素は、点群コンテンツを示すための必須@pcId属性と、点群の3D空間領域「1」を識別するための@regionIds属性とを含有する、VPCC記述子を含んでもよい。これらのV-PCC適合セットが、少なくとも1つの事前選択において参照されることを示すために、@value属性を伴わない事前選択記述子は、各AdaptationSet内でシグナリングされる。
【0121】
本実施例において、V-PCCコンポーネントAdaptationSetを使用して、V-PCC空間領域の事前選択をシグナリングする、例示的MPDファイルは、以下に説明される。
【化8-1】
【化8-2】
【化8-3】
【0122】
IX.実施形態5
【0123】
コンテンツコンポーネントを使用した、V-PCC空間領域の事前選択
【0124】
図3は、点群の2つの3D空間領域に属する、V-PCCコンポーネントの事前選択のための例示的MPEG-DASH構成を図示し、これは、コンテンツコンポーネントを使用して、3つのV-PCCコンポーネントトラックグループにマッピングされ得る。本実施形態では、V-PCCシーケンスは、占有率、幾何学形状、および属性のビデオコード化コンポーネント、およびアトラスのV-PCCコンポーネントから成る。
【0125】
ビデオコード化占有率、幾何学形状、および属性コンポーネントはそれぞれ、別個のAdaptationSetによってシグナリングされ得る。占有率、幾何学形状、および属性コンポーネントの各コンポーネントAdaptationSetは、対応する値に設定される、@component_type属性を伴う、VPCCComponent記述子を含む。
【0126】
本実施例では、アトラスサブビットストリームを含む、V-PCCトラックは、2つのメインAdaptationSetによってシグナリングされる。各メインAdaptationSetは、点群の3D空間領域、すなわち、「1」および「2」の識別子にそれぞれ設定される、@regionId属性を伴う、VPCCSpatialRegion記述子を有する。各メインAdaptationSetにおける、VPCCSpatialRegion記述子はまた、点群の3D空間領域に対応する、V-PCCコンポーネントトラックグループを識別するための@trackGroupIDs属性を有する。本実施例では、3D空間領域「1」は、「1 2」のtrack_group_idを伴う、V-PCCコンポーネントトラックグループにマッピングされ、3D空間領域「2」は、「2 3」のtrack_group_idを伴う、V-PCCコンポーネントトラックグループにマッピングされる。
【0127】
本実施例では、V-PCC占有率マップコンポーネントトラックは、コンポーネントAdaptationSet3内で搬送され、ContentComponent要素「1 2 3」によって記述される。V-PCC幾何学形状コンポーネントトラックは、コンポーネントAdaptationSet4内で搬送され、ContentComponent要素「4 5 6」によって記述される。V-PCC属性コンポーネントトラックは、コンポーネントAdaptationSet5内で搬送され、ContentComponent要素「7 8 9」によって記述される。
【0128】
track_group_id属性値「1」、「2」、および「3」を伴う、V-PCCコンポーネントトラックグループはそれぞれ、id属性値「1 4 7」、「2 5 8」、および「3 6 9」を伴う、ContentComponent要素にマッピングされるであろう。
【0129】
点群の3D空間領域「1」および領域「2」に属する、V-PCCコンポーネントは、MPD内で、2つのPreSelection要素を使用して、別個にグループ化される。空間領域「1」の事前選択のためのPreSelection要素の@preselectionComponents属性は、「1 2 4 6」として、idリストを含む。空間領域「2」の事前選択のためのPreSelection要素の@preselectionComponents属性は、idリスト「1 3 5 7」を含む。
【0130】
点群の3D空間領域「1」および領域「2」に属する、V-PCCコンポーネントは、MPD内で、2つのPreSelection要素を使用して、別個にグループ化される。(トラックグループ「1 2」にマッピングされる)空間領域「1」の事前選択のためのPreSelection要素の@preselectionComponents属性は、「1 1 2 4 5 7 8」として、idリストを含み、(トラックグループ「2 3」にマッピングされる)空間領域「2」の事前選択のためのPreSelection要素の@preselectionComponents属性は、「1 2 3 5 6 8 9」として、idリストを含む。事前選択におけるID 1は、点群データのためのメイン適合セットの識別子に対応し、ID1、2、4、5、7、および8は、コンテンツコンポーネントの識別子に対応する。
【0131】
点群を識別するために使用される、必須@pcId属性以外に、各PreSelection要素のVPCC記述子はまた、点群の3D空間領域、すなわち、領域「1」および「2」をそれぞれ記述するための@regionIds属性を含有するものとする。
【0132】
これらのV-PCC適合セットが、少なくとも1つの事前選択において参照されることを示すために、@value属性を伴わない事前選択記述子は、各AdaptationSet内でシグナリングされる。
【0133】
本実施形態において、ContentComponentを使用して、V-PCC空間領域の事前選択をシグナリングする、例示的MPDファイルは、以下に説明される。
【化9-1】
【化9-2】
【化9-3】
【0134】
3Dパーティションが動的であるとき、プレゼンテーションタイムラインにおいて、各3D領域の位置および寸法をシグナリングするための時間指定メタデータトラックは、単一の表現を伴う、別個のAdaptationSet内で搬送され、MPEG-DASHにおいて定義付けられ、対応するAdaptationSetまたはRepresentationのための4CC‘vpcm’を含む、@associationType値を伴う、@associationId属性を使用して、メインV-PCCトラックと関連付けられ得る。
【0135】
図4Aは、点群データ処理および伝送の例示的方法のフローチャートである。動作110は、点群データの1つまたはそれを上回る3次元(3D)空間領域を記述する、1つまたはそれを上回る空間領域記述子と、点群データと関連付けられる点群コンポーネントを記述する、1つまたはそれを上回る事前選択要素とを決定するステップを含む。動作120は、1つまたはそれを上回る空間領域記述子と、1つまたはそれを上回る事前選択要素とを含む、メディアプレゼンテーション記述(MPD)ファイルを伝送するステップを含む。
【0136】
図4Bは、点群データ受信および処理の例示的方法のフローチャートである。動作150は、点群データの1つまたはそれを上回る3次元(3D)空間領域を記述する、1つまたはそれを上回る空間領域記述子と、点群データと関連付けられる点群コンポーネントを記述する、1つまたはそれを上回る事前選択要素とを含む、メディアプレゼンテーション記述(MPD)ファイルを受信するステップを含む。動作160は、1つまたはそれを上回る事前選択要素の事前選択を伴って、点群データの1つまたはそれを上回る3D空間領域に対応する、点群コンポーネントにアクセスするステップを含む。いくつかの実施形態では、動作160のアクセスするステップは、点群データの1つまたはそれを上回る3D空間領域に対応する、点群コンポーネントにアクセスするために、1つまたはそれを上回る事前選択要素の事前選択要素を構文解析するステップを含んでもよい。
【0137】
以下の説明される特徴は、
図4A、
図4Bで説明される方法に対して、かつ本特許文書内で説明される種々の実施形態において、適用可能であり得る。
【0138】
いくつかの実施形態では、1つまたはそれを上回る空間領域記述子は、MPDファイル内の点群データのためのメイン適合セット内に含まれる。いくつかの実施形態では、1つまたはそれを上回る空間領域記述子はそれぞれ、1つまたはそれを上回る3D空間領域のオフセット値と、寸法とを含む。いくつかの実施形態では、1つまたはそれを上回る空間領域記述子はそれぞれ、点群データの3D境界ボックス情報を含む。いくつかの実施形態では、1つまたはそれを上回る事前選択要素は、点群データの1つまたはそれを上回るエンコードバージョンと関連付けられ、1つまたはそれを上回る事前選択要素はそれぞれ、点群データを識別する第1の値と、1つまたはそれを上回る3D空間領域を識別する第2の値とを含む。いくつかの実施形態では、1つまたはそれを上回る事前選択要素はそれぞれ、第1の値と第2の値とを含む、点群記述子要素を含む。
【0139】
いくつかの実施形態では、1つまたはそれを上回る事前選択要素はそれぞれ、点群データのためのメイン適合セットの識別子と、点群コンポーネントに対応する適合セットの複数の識別子とを含む。いくつかの実施形態では、点群コンポーネントトラックグループ識別子属性は、1つまたはそれを上回る空間領域記述子内に存在しない。いくつかの実施形態では、1つまたはそれを上回る事前選択要素はそれぞれ、前記点群データのためのメイン適合セットの識別子と、点群コンポーネントに対応するコンテンツコンポーネントの複数の識別子とを含む。いくつかの実施形態では、点群コンポーネントトラックグループ識別子は、1つまたはそれを上回る空間領域記述子内に存在する。
【0140】
いくつかの実施形態では、1つまたはそれを上回る事前選択要素はそれぞれ、識別子と複数の識別子とを含む、事前選択コンポーネント属性を含む。いくつかの実施形態では、1つまたはそれを上回る空間領域における、記述子内の点群コンポーネントトラックグループ識別子属性は、異なる適合セットからコンテンツコンポーネントにマッピングされる、3D空間領域に対応する。いくつかの実施形態では、点群コンポーネントは、アトラスデータ、占有率マップコンポーネント、幾何学的コンポーネント、または属性コンポーネントを含む。いくつかの実施形態では、点群コンポーネントは、点群データの1つまたはそれを上回る3D空間領域に対応する。
【0141】
図5は、ビデオエンコーダまたはビデオデコーダの一部であり得る、ハードウエアプラットフォーム500の例示的ブロック図を示す。ハードウエアプラットフォーム500は、少なくとも1つのプロセッサ510と、その上に記憶される命令を有するメモリ505とを含む。プロセッサ510による実行に応じて、命令は、
図1-4Bにおいて、またはそのために説明される動作を、かつ本特許文書内で説明される種々の実施形態において実施するように、ハードウエアプラットフォーム500を構成する。送信機515は、情報またはデータを別のデバイスに伝送または送信する。例えば、サーバ内のビデオエンコーダ送信機は、エンコードされたビデオを別のデバイス(例えば、モバイルデバイス)内のビデオデコーダに送信することができる。受信機520は、別のデバイスによって伝送または送信された情報またはデータを受信する。例えば、モバイルデバイスビデオデコーダは、別のデバイス(例えば、サーバ)からエンコードされたビデオデータを受信することができる。
【0142】
本文書では、用語「例示的」は、「実施例」を意味するために使用され、別様に記述されない限り、理想的なまたは好ましい実施形態を示唆しない。
【0143】
本明細書で説明される実施形態のうちのいくつかは、方法またはプロセスの一般的文脈において説明され、これは、コンピュータプログラム製品によって、一実施形態において実装されコンピュータ可読媒体内で具現化され、プログラムコード等のコンピュータ実行可能命令を含み、ネットワーク化された環境内のコンピュータによって実行され得る。コンピュータ可読媒体は、限定ではないが、読取専用メモリ(ROM)、ランダムアクセスメモリ(RAM)、コンパクトディスク(CD)、デジタル多用途ディスク(DVD)等を含む、可撤性および非可撤性記憶デバイスを含んでもよい。したがって、コンピュータ可読媒体は、非一過性の記憶媒体を含むことができる。一般に、プログラムモジュールは、特定のタスクを実施する、または特定の抽象データタイプを実装する、ルーチン、プログラム、オブジェクト、コンポーネント、データ構造等を含んでもよい。データ構造に関連付けられる、コンピュータまたはプロセッサ実行可能命令、およびプログラムモジュールは、本明細書に開示される方法の各ステップを実行するためのプログラムコードの実施例を表す。そのような実行可能命令の特定のシーケンス、または関連付けられるデータ構造は、そのようなステップまたはプロセスにおいて説明される機能を実装するために、対応する行動の実施例を表す。
【0144】
開示される実施形態のうちのいくつかは、ハードウェア回路、ソフトウエア、またはその組み合わせを使用する、デバイスまたはモジュールとして、実装されることができる。例えば、ハードウェア回路の実装は、例えば、プリント回路基板の一部として統合される、離散アナログおよび/またはデジタルコンポーネントを含むことができる。代替として、または追加として、開示されるコンポーネントまたはモジュールは、特定用途向け集積回路(ASIC)として、および/またはフィールドプログラマブルゲートアレイ(FPGA)デバイスとして、実装されることができる。いくつかの実装は、追加として、または代替として、本願の開示される機能性と関連付けられる、デジタル信号処理の動作的必要性のために最適化されたアーキテクチャを伴う、特殊化されたマイクロプロセッサである、デジタルシグナルプロセッサ(DSP)を含んでもよい。同様に、各モジュール内の種々のコンポーネントまたはサブコンポーネントは、ソフトウエア、ハードウエア、またはファームウエア内に実装されてもよい。モジュール間および/またはモジュール内のコンポーネント間の接続性は、限定ではないが、適切なプロトコルを使用して、インターネット、有線、または無線ネットワークを経由した通信を含む、当技術分野において公知である、接続方法および媒体の任意の1つを使用して、提供され得る。
【0145】
本特許文書は、多くの詳細を含有するが、これらは、請求される発明の、または請求され得るものの範囲への限定としてではなく、むしろ、特定の実施形態に特有の特徴の説明として解釈されるべきである。別個の実施形態の文脈において本文書に説明される、いくつかの特徴もまた、単一の実施形態において組み合わせて実装されることができる。逆に、単一の実施形態の文脈において説明される種々の特徴もまた、複数の実施形態において、別個に、または任意の好適な副次的組み合わせにおいて実装されることができる。また、特徴が、いくつかの組み合わせにおいて作用するものとして上記に説明され、さらに、そのようなものとして最初に請求され得るが、請求される組み合わせからの1つまたはそれを上回る特徴が、いくつかの場合において、組み合わせから削除されることができ、請求される組み合わせは、副次的組み合わせまたは副次的組み合わせの変形例を対象とし得る。同様に、動作が、特定の順序で図面に描写されるが、これは、望ましい結果を達成するために、そのような動作が、示される特定の順序で、または順次順序で実施されること、または全ての図示される動作が、実施されることを要求するものとして、理解されるべきではない。
【0146】
いくつかの実装および実施例のみが、説明され、他の実装、向上、および変形例は、本開示内に説明および図示されるものに基づいて、行われることができる。