IP Force 特許公報掲載プロジェクト 2022.1.31 β版

知財求人 - 知財ポータルサイト「IP Force」

▶ エルジー エレクトロニクス インコーポレイティドの特許一覧

特表2024-542105ポイントクラウドデータ送信装置、ポイントクラウドデータ送信方法、ポイントクラウドデータ受信装置及びポイントクラウドデータ受信方法
(19)【発行国】日本国特許庁(JP)
(12)【公報種別】公表特許公報(A)
(11)【公表番号】
(43)【公表日】2024-11-13
(54)【発明の名称】ポイントクラウドデータ送信装置、ポイントクラウドデータ送信方法、ポイントクラウドデータ受信装置及びポイントクラウドデータ受信方法
(51)【国際特許分類】
   G06T 9/40 20060101AFI20241106BHJP
   H04N 19/597 20140101ALI20241106BHJP
【FI】
G06T9/40
H04N19/597
【審査請求】未請求
【予備審査請求】未請求
(21)【出願番号】P 2024526631
(86)(22)【出願日】2022-11-02
(85)【翻訳文提出日】2024-05-24
(86)【国際出願番号】 KR2022016952
(87)【国際公開番号】W WO2023080606
(87)【国際公開日】2023-05-11
(31)【優先権主張番号】10-2021-0149968
(32)【優先日】2021-11-03
(33)【優先権主張国・地域又は機関】KR
(81)【指定国・地域】
(71)【出願人】
【識別番号】502032105
【氏名又は名称】エルジー エレクトロニクス インコーポレイティド
【氏名又は名称原語表記】LG ELECTRONICS INC.
【住所又は居所原語表記】128, Yeoui-daero, Yeongdeungpo-gu, 07336 Seoul,Republic of Korea
(74)【代理人】
【識別番号】100109841
【弁理士】
【氏名又は名称】堅田 健史
(74)【代理人】
【識別番号】230112025
【弁護士】
【氏名又は名称】小林 英了
(74)【代理人】
【識別番号】230117802
【弁護士】
【氏名又は名称】大野 浩之
(74)【代理人】
【識別番号】100131451
【弁理士】
【氏名又は名称】津田 理
(74)【代理人】
【識別番号】100167933
【弁理士】
【氏名又は名称】松野 知紘
(74)【代理人】
【識別番号】100184181
【弁理士】
【氏名又は名称】野本 裕史
(72)【発明者】
【氏名】ホ,ヘジョン
【テーマコード(参考)】
5C159
【Fターム(参考)】
5C159MA04
5C159MA05
5C159MC11
5C159ME01
5C159PP03
5C159UA02
5C159UA05
(57)【要約】
【要約】 実施例によるポイントクラウドデータ送信方法は、ポイントクラウドデータを符号化する段階;及びポイントクラウドデータを含むビットストリームを送信する段階;を含む。実施例によるポイントクラウドデータ送信方法は、ポイントクラウドデータを含むビットストリームを受信する段階;及びポイントクラウドデータを復号する段階;を含む。
【特許請求の範囲】
【請求項1】
ポイントクラウドデータ送信方法であって、
ポイントクラウドデータを符号化する段階;及び
前記ポイントクラウドデータを含むビットストリームを送信する段階;を含んでなる、ポイントクラウドデータ送信方法。
【請求項2】
前記ポイントクラウドデータを符号化する段階は、前記ポイントクラウドデータをマテリアルIDに基づいてグループ化する段階を含み、
前記ポイントクラウドデータはマテリアルIDを含む特質データを含み、
前記特質データはカラーを含み、
同じマテリアルIDを有するポイントクラウドデータの特質データは互いに類似する、請求項1に記載のポイントクラウドデータ送信方法。
【請求項3】
前記ポイントクラウドデータを符号化する段階は、
前記ポイントクラウドデータのジオメトリデータをツリーに基づいて符号化する段階、
前記ポイントクラウドデータの特質データを前記ツリーに基づいてグループ化する段階、を含み、
前記特質データをグループ化する段階は、
前記ツリーに含まれたノードに含まれる1つ又は1つ以上のポイントのうち、類似する特質データを有するポイントをグループ化し、
前記1つ又は1つ以上のポイントの特質データの中央値、最小値、及び最大値間の差異値が閾値より小さい場合、前記1つ又は1つ以上のポイントをグループとして生成する、請求項1に記載のポイントクラウドデータ送信方法。
【請求項4】
前記ポイントクラウドデータを符号化する段階は、前記グループ化された特質データに対するLOD(Level of Detail)を生成する段階を更に含み、
前記LODに含まれたポイントはモールトンコードに基づいて整列される、請求項3に記載のポイントクラウドデータ送信方法。
【請求項5】
前記ポイントクラウドデータを符号化する段階は、前記LODに基づいて、前記ポイントクラウドデータの隣接ポイント集合を生成する段階を更に含み、
前記隣接ポイント集合は、前記ポイントクラウドデータが属するLODのインデックスと等しいか又は小さいインデックスを有するLODに含まれるポイントから検索範囲に基づいて検索される、請求項4に記載のポイントクラウドデータ送信方法。
【請求項6】
前記ビットストリームは類似特質グループ化に関する情報を含む、請求項1に記載のポイントクラウドデータ送信方法。
【請求項7】
ポイントクラウドデータ送信装置であって、
ポイントクラウドデータを符号化するエンコーダー;及び
前記ポイントクラウドデータを含むビットストリームを送信する送信機;を備えてなる、ポイントクラウドデータ送信装置。
【請求項8】
ポイントクラウドデータ受信方法であって、
ポイントクラウドデータを含むビットストリームを受信する段階;及び
前記ポイントクラウドデータを復号する段階;を含んでなる、ポイントクラウドデータ受信方法。
【請求項9】
前記ポイントクラウドデータを復号する段階は、前記ポイントクラウドデータをマテリアルIDに基づいてグループ化する段階を含み、
前記ポイントクラウドデータは、マテリアルIDを含む特質データを含み、
前記特質データはカラーを含み、
同じマテリアルIDを有するポイントクラウドデータの特質データは互いに類似する、請求項8に記載のポイントクラウドデータ受信方法。
【請求項10】
前記ポイントクラウドデータを復号する段階は、
前記ポイントクラウドデータのジオメトリデータをツリーに基づいて復号する段階、
前記ポイントクラウドデータの特質データを前記ツリーに基づいてグループ化する段階、を含み、
前記特質データをグループ化する段階は、
前記ツリーに含まれたノードに含まれる1つ又は1つ以上のポイントのうち、類似する特質データを有するポイントをグループ化し、
前記1つ又は1つ以上のポイントの特質データの中央値、最小値、及び最大値間の差異値が閾値より小さい場合、前記1つ又は1つ以上のポイントをグループとして生成する、請求項8に記載のポイントクラウドデータ受信方法。
【請求項11】
前記ポイントクラウドデータを復号する段階は、前記グループ化された特質データに対するLOD(Level of Detail)を生成する段階を更に含み、
前記LODに含まれたポイントはモールトンコードに基づいて整列される、請求項10に記載のポイントクラウドデータ受信方法。
【請求項12】
前記ポイントクラウドデータを復号する段階は、前記LODに基づいて、前記ポイントクラウドデータの隣接ポイント集合を生成する段階を更に含み、
前記隣接ポイント集合は前記ポイントクラウドデータが属するLODのインデックスと等しいか又は小さいインデックスを有するLODに含まれたポイントから検索範囲に基づいて検索される、請求項11に記載のポイントクラウドデータ受信方法。
【請求項13】
前記ビットストリームは類似特質グループ化に関する情報を含む、請求項8に記載のポイントクラウドデータ受信方法。
【請求項14】
ポイントクラウドデータ受信装置であって、
ポイントクラウドデータを含むビットストリームを受信する受信部;及び
前記ポイントクラウドデータを復号するデコーダー;を備えてなる、ポイントクラウドデータ受信装置。
【請求項15】
前記デコーダーは、前記ポイントクラウドデータを復号し、前記ポイントクラウドデータをマテリアルIDに基づいてグループ化するものであり、
前記ポイントクラウドデータはマテリアルIDを含む特質データを含み、
前記特質データはカラーを含み、
同じマテリアルIDを有するポイントクラウドデータの特質データは互いに類似する、請求項14に記載のポイントクラウドデータ受信装置。



【発明の詳細な説明】
【技術分野】
【0001】
実施例はポイントクラウドコンテンツ(Point Cloud Content)を処理する方法及び装置に関する。
【背景技術】
【0002】
ポイントクラウドコンテンツは3次元空間を表現する座標系に属する点(ポイント)の集合であるポイントクラウドで表現されるコンテンツである。ポイントクラウドコンテンツは3次元からなるメディアを表現でき、VR(Virtual Reality、仮想現実)、AR(Augmented Reality、拡張現実)、MR(Mixed Reality、複合現実)及び自律走行サービスなどの様々なサービスを提供するために使用される。しかし、ポイントクラウドコンテンツを表現するためには、数万から数十万個のポイントデータが必要である。従って、膨大な量のポイントデータを効率的に処理する方法が求められる。
【発明の概要】
【発明が解決しようとする課題】
【0003】
実施例はポイントクラウドデータを効率的に処理するための装置及び方法を提供する。実施例は遅延(latency)及び符号化/復号複雑度を解決するためのポイントクラウドデータ処理方法及び装置を提供する。
【0004】
但し、上述した技術的課題のみに制限されず、記載する全ての内容に基づいて当業者が導き出される他の技術的課題にも実施例の権利範囲を拡張することができる。
【課題を解決するための手段】
【0005】
実施例によるポイントクラウドデータ送信方法は、ポイントクラウドデータを符号化する段階;及びポイントクラウドデータを含むビットストリームを送信する段階;を含む。実施例によるポイントクラウドデータ送信方法は、ポイントクラウドデータを含むビットストリームを受信する段階;及びポイントクラウドデータを復号する段階;を含む(備える;構成する;構築する;設定する;包接する;包含する;含有する)。
【発明の効果】
【0006】
実施例による装置及び方法は、高効率でポイントクラウドデータを処理することができる。
【0007】
実施例による装置及び方法は、良質のポイントクラウドサービスを提供することができる。
【0008】
実施例による装置及び方法は、VRサービス、自律走行サービスなどの汎用的なサービスを提供するためのポイントクラウドコンテンツを提供することができる。
【図面の簡単な説明】
【0009】
添付図面は実施例の理解を助けるためのものであり、実施例に関連する説明と共に実施例を示す。後述する様々な実施例に対するより適切な理解のために、添付図面において類似する参照番号に対応する部分を含む次の図面に関連して以下の実施例の説明を必ず参照すべきである。
図1】実施例によるポイントクラウドコンテンツ提供システムの一例を示す。
図2】実施例によるポイントクラウドコンテンツ提供動作を示すブロック図である。
図3】実施例によるポイントクラウドビデオキャプチャー過程の一例を示す。
図4】実施例によるポイントクラウドエンコーダー(Point Cloud Encoder)の一例を示す。
図5】実施例によるボクセルの一例を示す。
図6】実施例による八分木及び占有コード(occupancy code)の一例を示す。
図7】実施例による隣接ノードパターンの一例を示す。
図8】実施例によるLODごとのポイント構成の一例を示す。
図9】実施例によるLODごとのポイント構成の一例を示す。
図10】実施例によるポイントクラウドデコーダー(Point Cloud Decoder)の一例を示す。
図11】実施例によるポイントクラウドデコーダー(Point Cloud Decoder)の一例を示す。
図12】実施例によるポイントクラウドデータ送信装置の一例を示す。
図13】実施例によるポイントクラウドデータ受信装置の一例を示す。
図14】実施例によるポイントクラウドデータ送受信方法/装置に連動可能な構造の一例を示す。
図15】実施例によるマテリアルID(material ID)によるグループ化の一例を示す。
図16】実施例による八分木構造の類似属性別のグループ化の一例を示す。
図17】実施例による隣接ポイント集合検索方法の一例を示す。
図18】実施例によるポイントクラウドデータ送信装置を示す。
図19】実施例によるポイントクラウドデータ受信装置を示す。
図20】実施例によるポイントクラウドデータ及び/又はパラメータを含むビットストリームを示す。
図21】実施例によるシーケンスパラメータセットの構文を示す。
図22】実施例による特質パラメータセットの構文を示す。
図23】実施例によるタイルパラメータセットの構文を示す。
図24】実施例による特質データヘッダの構文を示す。
図25】実施例によるポイントクラウドデータ送信方法を示す。
図26】実施例によるポイントクラウドデータ受信方法を示す。
【発明を実施するための形態】
【0010】
添付図面を参照しながら望ましい実施例について具体的に説明する。添付図面を参照した以下の詳細な説明は、実施例によって具現可能な実施例のみを示すというより、望ましい実施例を説明するためのものである。以下の詳細な説明は実施例に関する徹底な理解を提供するために細部事項を含む。しかし、かかる細部事項がなくても実施例を実行できることは当業者にとって明らかである。
【0011】
実施例で使用するほとんどの用語は該当分野において広く使用される一般的なものであるが、一部は出願人によって任意に選択されたものもあり、その意味は必要によって以下に詳しく説明する。よって、実施例は用語の単純な名称や意味ではなく、用語が意図する意味に基づいて理解すべきである。
【0012】
図1は実施例によるポイントクラウドコンテンツ提供システムの一例を示す図である。
【0013】
図1に示したポイントクラウドコンテンツ提供システムは、送信装置(transmission device)10000及び受信装置(reception device)10004を含む。送信装置10000及び受信装置10004はポイントクラウドデータを送受信するために有無線通信が可能である。
【0014】
実施例による送信装置10000は、ポイントクラウドビデオ(又はポイントクラウドコンテンツ)を確保し処理して送信する。実施例において、送信装置10000は固定局(fixed station)、BTS(base transceiver system)、ネットワーク、AI(Ariticial Intelligence)機器及び/又はシステム、ロボット、AR/VR/XR機器及び/又はサーバーなどを含む。また実施例において、送信装置10000は無線接続技術(例、5G NR(New RAT)、LTE(Long Term Evolution))を用いて、基地局及び/又は他の無線機器と通信を行う機器、ロボット、車両、AR/VR/XR機器、携帯機器、家電、IoT(Internet of Thing)機器、AI機器/サーバーなどを含む。
【0015】
実施例による送信装置10000は、ポイントクラウドビデオ獲得部(Point Cloud Video Acquisition)10001、ポイントクラウドビデオエンコーダー(Point Cloud Video Encoder)10002及び/又は送信機(Transmitter(又は通信モジュール)10003を含む。
【0016】
実施例によるポイントクラウドビデオ獲得部10001は、キャプチャー、合成又は生成などの処理過程によりポイントクラウドビデオを獲得する。ポイントクラウドビデオは、3次元空間に位置するポイントの集合であるポイントクラウドで表現されるポイントクラウドコンテンツであって、ポイントクラウドビデオデータなどと呼ばれる。実施例によるポイントクラウドビデオは、一つ又はそれ以上のフレームを含む。一つのフレームは停止映像/ピクチャを示す。よって、ポイントクラウドビデオはポイントクラウド映像/フレーム/ピクチャを含み、ポイントクラウド映像、フレーム及びピクチャのうちのいずれかに呼ばれる。
【0017】
実施例によるポイントクラウドビデオエンコーダー10002は、確保したポイントクラウドビデオデータを符号化する。ポイントクラウドビデオエンコーダー10002はポイントクラウド圧縮(Point Cloud Compression)コーディングに基づいてポイントクラウドビデオデータを符号化する。実施例によるポイントクラウド圧縮コーディングは、G-PCC(Geometry-based Point Cloud Compression)コーディング及び/又はV-PCC(Video based Point Cloud Compression)コーディング又は次世代コーディングを含む。なお、実施例によるポイントクラウド圧縮コーディングは、上述した実施例に限られない。ポイントクラウドビデオエンコーダー10002は、符号化されたポイントクラウドビデオデータを含むビットストリームを出力する。ビットストリームは符号化されたポイントクラウドビデオデータだけではなく、ポイントクラウドビデオデータの符号化に関連するシグナリング情報を含む。
【0018】
実施例による送信機10003は、符号化されたポイントクラウドビデオデータを含むビットストリームを送信する。実施例によるビットストリームはファイル又はセグメント(例えば、ストリーミングセグメント)などにカプセル化されて、放送網及び/又はブロードバンド網などの様々なネットワークにより送信される。図示していないが、送信装置10000はカプセル化動作を行うカプセル化部(又はカプセル化モジュール)を含む。また実施例において、カプセル化部は送信機10003に含まれる。実施例において、ファイル又はセグメントはネットワークにより受信装置10004に送信されるか、又はデジタル格納媒体(例えば、USB、SD、CD、DVD、ブルーレイ、HDD、SSDなど)に格納される。実施例による送信機10003は受信装置10004(又は受信機(Receiver)10005)と4G、5G、6Gなどのネットワークにより有無線通信が可能である。また送信機10003はネットワークシステム(例えば、4G、5G、6Gなどの通信ネットワークシステム)によって必要なデータ処理動作を行う。また送信装置10000はオン・デマンド(On Demand)方式によってカプセル化されたデータを送信することもできる。
【0019】
実施例による受信装置10004は、受信機(Receiver)10005、ポイントクラウドビデオデコーダー(Point Cloud Decoder)10006及び/又はレンダラー(Renderer)10007を含む。実施例において、受信装置10004は無線接続技術(例、5G NR(New RAT)、LTE(Long Term Evolution))を用いて、基地局及び/又は他の無線機器と通信を行う機器、ロボット、車両、AR/VR/XR機器、携帯機器、家電、IoT(Internet of Thing)機器、AI機器/サーバーなどを含む。
【0020】
実施例による受信機10005は、ポイントクラウドビデオデータを含むビットストリーム又はビットストリームがカプセル化されたファイル/セグメントなどをネットワーク又は格納媒体から受信する。受信機10005はネットワークシステム(例えば、4G、5G、6Gなどの通信ネットワークシステム)により必要なデータ処理動作を行う。実施例による受信機10005は、受信したファイル/セグメントをデカプセル化してビットストリームを出力する。また実施例において、受信機10005はデカプセル化の動作を行うためのデカプセル化部(又はデカプセル化モジュール)を含む。またデカプセル化部は受信機10005とは別個のエレメント(又はコンポーネント)で具現される。
【0021】
ポイントクラウドビデオデコーダー10006は、ポイントクラウドビデオデータを含むビットストリームを復号する。ポイントクラウドビデオデコーダー10006はポイントクラウドビデオデータが符号化された方式により復号することができる(例えば、ポイントクラウドビデオエンコーダー10002の動作の逆の過程)。従って、ポイントクラウドビデオデコーダー10006はポイントクラウド圧縮の逆過程であるポイントクラウド復元コーディングを行って、ポイントクラウドビデオデータを復号することができる。ポイントクラウド復元コーディングはG-PCCコーディングを含む。
【0022】
レンダラー10007は復号されたポイントクラウドビデオデータをレンダリングする。レンダラー10007はポイントクラウドビデオデータだけではなく、オディオデータもレンダリングしてポイントクラウドコンテンツを出力する。実施例において、レンダラー10007はポイントクラウドコンテンツをディスプレイするためのディスプレイを含む。実施例において、ディスプレイはレンダラー10007に含まれず、別のデバイス又はコンポーネントで具現される。
【0023】
図面において、点線で示した矢印は、受信装置10004で得たフィードバック情報(feedback information)の送信経路を示す。フィードバック情報はポイントクラウドコンテンツを消費するユーザとの相互作用を反映するための情報であって、ユーザの情報を含む(例えば、ヘッドオリエンテーション情報、ビューポート情報など)。特にポイントクラウドコンテンツがユーザとの相互作用が必要なサービス(例えば、自律走行サービスなど)のためのものである場合には、フィードバック情報はコンテンツ送信側(例えば、送信装置10000)及び/又はサービス供給者に伝達されることができる。実施例において、フィードバック情報は送信装置10000だけではなく受信装置10004でも使用されることができ、提供されないこともできる。
【0024】
実施例によるヘッドオリエンテーション情報はユーザの頭の位置、方向、角度、動きなどに関する情報である。実施例による受信装置10004はヘッドオリエンテーション情報に基づいてビューポート情報を計算する。ビューポート情報はユーザが見ているポイントクラウドビデオの領域に関する情報である。視点(viewpoint)はユーザがポイントクラウドビデオを見ている点であり、ビューポート領域の真ん中を意味する。即ち、ビューポートは視点を中心とする領域であり、領域のサイズ、形態などはFOV(Field Of View)により決定される。従って、受信装置10004はヘッドオリエンテーション情報以外に、装置が支援する垂直(vertical)或いは水平(horizontal)FOVなどに基づいてビューポート情報を抽出することができる。また受信装置10004はゲイズ分析(Gaze Analysis)などを行って、ユーザのポイントクラウド消費方式、ユーザが凝視するポイントクラウドビデオ領域、凝視時間などを確認する。実施例において、受信装置10004はゲイズ分析の結果を含むフィードバック情報を送信装置10000に送信する。実施例によるフィードバック情報はレンダリング及び/又はディスプレイ過程で得られる。実施例によるフィードバック情報は受信装置10004に含まれた一つ又はそれ以上のセンサにより確保される。また実施例において、フィードバック情報はレンダラー10007又は別の外部エレメント(又はデバイス、コンポーネントなど)により確保される。図1に示された点線はレンダラー10007で確保したフィードバック情報の伝達過程を示す。ポイントクラウドコンテンツ提供システムはフィードバック情報に基づいてポイントクラウドデータを処理(符号化/復号)する。従って、ポイントクラウドビデオデータデコーダー10006はフィードバック情報に基づいて復号の動作を行うことができる。また受信装置10004はフィードバック情報を送信装置10000に送信することができる。送信装置10000(又はポイントクラウドビデオデータエンコーダー10002)はフィードバック情報に基づいて符号化の動作を行う。従って、ポイントクラウドコンテンツ提供システムは全てのポイントクラウドデータを処理(符号化/復号)せず、フィードバック情報に基づいて必要なデータ(例えば、ユーザのヘッド位置に対応するポイントクラウドデータ)を効率的に処理して、ユーザにポイントクラウドコンテンツを提供することができる。
【0025】
実施例において、送信装置10000はエンコーダー、送信デバイス、送信機などと呼ばれ、受信装置10004はデコーダー、受信デバイス、受信機などと呼ばれる。
【0026】
実施例による図1のポイントクラウドコンテンツ提供システムで処理される(獲得/符号化/送信/復号/レンダリングの一連の過程で処理される)ポイントクラウドデータは、ポイントクラウドコンテンツデータ又はポイントクラウドビデオデータとも呼ばれる。実施例において、ポイントクラウドコンテンツデータはポイントクラウドデータに関連するメタデータ或いはシグナリング情報を含む概念として使用される。
【0027】
図1に示したポイントクラウドコンテンツ提供システムのエレメントは、ハードウェア、ソフトウェア、プロセッサ及び/又はこれらの組み合わせなどで具現される。
【0028】
図2は実施例によるポイントクラウドコンテンツ提供の動作を示すブロック図である。
【0029】
図2図1で説明したポイントクラウドコンテンツ提供システムの動作を示すブロック図である。上述したように、ポイントクラウドコンテンツ提供システムは、ポイントクラウド圧縮コーディング(例えば、G-PCC)に基づいてポイントクラウドデータを処理する。
【0030】
実施例によるポイントクラウドコンテンツ提供システム(例えば、ポイントクラウド送信装置10000又はポイントクラウドビデオ獲得部10001)では、ポイントクラウドビデオを獲得する(20000)。ポイントクラウドビデオは3次元空間を表現する座標系に属するポイントクラウドで表現される。実施例によるポイントクラウドビデオはPly(Polygon File format or the Stanford Triangle format)ファイルを含む。ポイントクラウドビデオが一つ又はそれ以上のフレームを有する場合、獲得したポイントクラウドビデオは一つ又はそれ以上のPlyファイルを含む。Plyファイルはポイントのジオメトリ(Geometry)及び/又は特質(Attribute)のようなポイントクラウドデータを含む。ジオメトリはポイントの位置を含む。それぞれのポイントの位置は3次元座標系(例えば、XYZ軸からなる座標系など)を示すパラメータ(例えば、X軸、Y軸、Z軸それぞれの値)で表現される。特質はポイントの特質(例えば、それぞれのポイントのテクスチャ情報、色相(YCbCr又はRGB)、反射率(r)、透明度など)を含む。一つのポイントは一つ又はそれ以上の特質(又は属性)を有する。例えば、一つのポイントは、色相の一つの特質を有するか、或いは色相及び反射率の二つの特質を有することができる。実施例において、ジオメトリは位置、ジオメトリ情報、ジオメトリデータなどとも呼ばれ、特質は特質、特質情報、特質データなどとも呼ばれる。またポイントクラウドコンテンツ提供システム(例えば、ポイントクラウド送信装置10000又はポイントクラウドビデオ獲得部10001)は、ポイントクラウドビデオの獲得過程に関連する情報(例えば、深さ情報、色相情報など)からポイントクラウドデータを確保することができる。
【0031】
実施例によるポイントクラウドコンテンツ提供システム(例えば、送信装置10000又はポイントクラウドビデオエンコーダー10002)は、ポイントクラウドデータを符号化する(20001)。ポイントクラウドコンテンツ提供システムは、ポイントクラウド圧縮コーディングに基づいてポイントクラウドデータを符号化する。上述したように、ポイントクラウドデータはポイントのジオメトリ及び特質を含む。よって、ポイントクラウドコンテンツ提供システムは、ジオメトリを符号化するジオメトリ符号化を行ってジオメトリビットストリームを出力する。ポイントクラウドコンテンツ提供システムは、特質を符号化する特質符号化を行って特質ビットストリームを出力する。実施例において、ポイントクラウドコンテンツ提供システムはジオメトリ符号化に基づいて特質符号化を行う。実施例によるジオメトリビットストリーム及び特質ビットストリームは多重化されて一つのビットストリームで出力される。実施例によるビットストリームはさらにジオメトリ符号化及び特質符号化に関連するシグナリング情報を含む。
【0032】
実施例によるポイントクラウドコンテンツ提供システム(例えば、送信装置10000又は送信機10003)は、符号化されたポイントクラウドデータを送信する(20002)。図1で説明したように、符号化されたポイントクラウドデータはジオメトリビットストリーム、特質ビットストリームで表現される。また符号化されたポイントクラウドデータはポイントクラウドデータの符号化に関連するシグナリング情報(例えば、ジオメトリ符号化及び特質符号化に関連するシグナリング情報)と共に、ビットストリームの形態で送信される。またポイントクラウドコンテンツ提供システムは符号化されたポイントクラウドデータを送信するビットストリームをカプセル化してファイル又はセグメントの形態で送信する。
【0033】
実施例によるポイントクラウドコンテンツ提供システム(例えば、受信装置10004又は受信機10005)は、符号化されたポイントクラウドデータを含むビットストリームを受信する。またポイントクラウドコンテンツ提供システム(例えば、受信装置10004又は受信機10005)は、ビットストリームを逆多重化する。
【0034】
ポイントクラウドコンテンツ提供システム(例えば、受信装置10004又はポイントクラウドビデオデコーダー10005)は、ビットストリームで送信される符号化されたポイントクラウドデータ(例えば、ジオメトリビットストリーム、特質ビットストリーム)を復号する。ポイントクラウドコンテンツ提供システム(例えば、受信装置10004又はポイントクラウドビデオデコーダー10005)は、ビットストリームに含まれたポイントクラウドビデオデータの符号化に関連するシグナリング情報に基づいてポイントクラウドビデオデータを復号する。ポイントクラウドコンテンツ提供システム(例えば、受信装置10004又はポイントクラウドビデオデコーダー10005)は、ジオメトリビットストリームを復号してポイントの位置(ジオメトリ)を復元する。ポイントクラウドコンテンツ提供システムは、復元したジオメトリに基づいて特質ビットストリームを復号してポイントの特質を復元する。ポイントクラウドコンテンツ提供システム(例えば、受信装置10004又はポイントクラウドビデオデコーダー10005)は、復元されたジオメトリによる位置及び復号された特質に基づいてポイントクラウドビデオを復元する。
【0035】
実施例によるポイントクラウドコンテンツ提供システム(例えば、受信装置10004又はレンダラー10007)は、復号されたポイントクラウドデータをレンダリングする(20004)。ポイントクラウドコンテンツ提供システム(例えば、受信装置10004又はレンダラー10007)は、復号過程で復号されたジオメトリ及び特質を様々なレンダリング方式によってレンダリングする。ポイントクラウドコンテンツのポイントは、一定の厚さを有する定点、該当定点の位置を中央とする所定の最小サイズを有する立方体、又は定点の位置を中央とする円などにレンダリングされる。レンダリングされたポイントクラウドコンテンツの全部又は一部の領域はディスプレイ(例えば、VR/ARディスプレイ、一般ディスプレイなど)によりユーザに提供される。
【0036】
実施例によるポイントクラウドコンテンツ提供システム(例えば、受信装置10004)は、フィードバック情報を確保することができる(20005)。ポイントクラウドコンテンツ提供システムは、フィードバック情報に基づいてポイントクラウドデータを符号化及び/又は復号する。実施例によるフィードバック情報及びポイントクラウドコンテンツ提供システムの動作は、図1で説明したフィードバック情報及び動作と同一であるので、具体的な説明は省略する。
【0037】
図3は実施例によるポイントクラウドビデオキャプチャー過程の一例を示す図である。
【0038】
図3図1及び図2で説明したポイントクラウドコンテンツ提供システムのポイントクラウドビデオキャプチャー過程の一例を示す。
【0039】
ポイントクラウドコンテンツは、様々な3次元空間(例えば、現実環境を示す3次元空間、仮想環境を示す3次元空間など)に位置するオブジェクト(object)及び/又は環境を示すポイントクラウドビデオ(イメージ及び/又は映像)を含む。従って、実施例によるポイントクラウドコンテンツ提供システムは、ポイントクラウドコンテンツを生成するために一つ又はそれ以上のカメラ(例えば、深さ情報を確保できる赤外線カメラ、深さ情報に対応する色相情報を抽出できるRGBカメラなど)、プロジェクト(例えば、深さ情報を確保するための赤外線パターンプロジェクターなど)、LiDARなどを使用してポイントクラウドビデオをキャプチャーする。実施例によるポイントクラウドコンテンツ提供システムは、深さ情報から3次元空間上のポイントで構成されたジオメトリの形態を抽出し、色相情報からそれぞれのポイントの特質を抽出してポイントクラウドデータを確保する。実施例によるイメージ及び/又は映像は内向き(inward-facing)方式及び外向き(outward-facing)方式のうちのいずれかに基づいてキャプチャーされる。
【0040】
図3の左側には内向き方式が示されている。内向き方式は中心オブジェクトを取り囲んで位置する一つ又はそれ以上のカメラ(又はカメラセンサ)が中心オブジェクトをキャプチャーする方式である。内向き方式は核心核心客体に対する360°イメージをユーザに提供するポイントクラウドコンテンツ(例えば、ユーザに客体(例:キャラクター、選手、品物、俳優などの核心となる客体)の360°イメージを提供するVR/ARコンテンツ)を生成するために使用される。
【0041】
図3の右側には外向き方式が示されている。外向き方式は中心オブジェクトを取り囲んで位置する一つ又はそれ以上のカメラ(又はカメラセンサ)が中心オブジェクトではない中心オブジェクトの環境をキャプチャーする方式である。外向き方式はユーザの視点からの周辺環境を提供するためのポイントクラウドコンテンツ(例えば、自律走行車両のユーザに提供される外部環境を示すコンテンツ)を生成するために使用される。
【0042】
図示したように、ポイントクラウドコンテンツは一つ又はそれ以上のカメラのキャプチャー動作に基づいて生成される。この場合、それぞれのカメラの座標系が異なるので、ポイントクラウドコンテンツ提供システムはキャプチャー動作前にグローバル空間座標系(global coordinate system)を設定するために、一つ又はそれ以上のカメラの較正(calibration)を行う。またポイントクラウドコンテンツ提供システムは、上述したキャプチャー方式でキャプチャーされたイメージ及び/又は映像と任意のイメージ及び/又は映像を合成してポイントクラウドコンテンツを生成する。またポイントクラウドコンテンツ提供システムは、仮想空間を示すポイントクラウドコンテンツを生成する場合、図3で説明したキャプチャー動作を行わない。実施例によるポイントクラウドコンテンツ提供システムは、キャプチャーしたイメージ及び/又は映像に対して後処理を行うこともできる。即ち、ポイントクラウドコンテンツ提供システムは、望まない領域(例えば、背景)を除去したり、キャプチャーしたイメージ及び/又は映像が連結された空間を認識して空間(spatial hole)がある場合、それを埋める動作を行うことができる。
【0043】
またポイントクラウドコンテンツ提供システムは、それぞれのカメラから確保したポイントクラウドビデオのポイントに対して座標系変換を行って、一つのポイントクラウドコンテンツを生成することができる。ポイントクラウドコンテンツ提供システムは、それぞれのカメラの位置座標を基準としてポイントの座標系変換を行う。これにより、ポイントクラウドコンテンツ提供システムは、一つの広い範囲を示すコンテンツを生成するか、或いはポイントの密度が高いポイントクラウドコンテンツを生成することができる。
【0044】
図4は実施例によるポイントクラウドエンコーダー(Point Cloud Encoder)の一例を示す図である。
【0045】
図4図1のポイントクラウドビデオエンコーダー10002の一例を示す。ポイントクラウドエンコーダーは、ネットワーク状況或いはアプリケーションなどによってポイントクラウドコンテンツの質(例えば、無損失-lossless、損失-lossy、損失に近い-near-lossless)を調節するために、ポイントクラウドデータ(例えば、ポイントの位置及び/又は特質)を再構成して符号化動作を行う。ポイントクラウドコンテンツの全体サイズが大きい場合(例えば、30fpsの場合、60Gbpsであるポイントクラウドコンテンツ)、ポイントクラウドコンテンツ提供システムは該当コンテンツをリアルタイムストリーミングすることができない。従って、ポイントクラウドコンテンツ提供システムは、ネットワーク環境などに合わせて提供するために、最大ターゲットビットレートに基づいてポイントクラウドコンテンツを再構成することができる。
【0046】
図1及び図2に示したように、ポイントクラウドエンコーダーはジオメトリ符号化及び特質符号化を行うことができる。ジオメトリ符号化は特質符号化よりも先に行われる。
【0047】
実施例によるポイントクラウドエンコーダーは、座標系変換部(Transformation Coordinates)40000、量子化部(Quantize and Remove Points(Voxelize))40001、八分木分析部(Analyze Octree)40002、表面近似分析部(Analyze Surface Approximation)40003、演算エンコーダー(Arithmetic Encode)40004、ジオメトリ再構成部(Reconstruct Geometry)40005、色変換部(Transform Colors)40006、特質変換部(Transfer Attributes)40007、RAHT変換部40008、LOD生成部(Generated LOD)40009、リフト変換部(Lifting)40010、係数量子化部(Quantize Coefficients)40011及び/又は演算エンコーダー(Arithmetic Encode)40012を含む。
【0048】
座標系変換部40000、量子化部40001、八分木分析部40002、表面近似分析部40003、演算エンコーダー40004及びジオメトリ再構成部40005は、ジオメトリ符号化を行う。実施例によるジオメトリ符号化は、八分木ジオメトリコーディング、ダイレクトコーディング(direct coding)、trisoupジオメトリ符号化(trisoup geometry encoding)及びエントロピー符号化を含む。ダイレクトコーディング及びtrisoupジオメトリ符号化は選択的に或いは組み合わせて適用される。なお、ジオメトリ符号化は上記の例示に限られない。
【0049】
図示したように、実施例による座標系変換部40000は、位置を受信して座標系(coordinate)に変換する。例えば、位置は3次元空間(例えば、XYZ座標系で表現される3次元空間など)の位置情報に変換される。実施例による3次元空間の位置情報はジオメトリ情報とも称される。
【0050】
実施例による量子化部40001はジオメトリを量子化する。例えば、量子化部40001は全体ポイントの最小位置値(例えば、X軸、Y軸、Z軸に対して各軸上の最小値)に基づいてポイントを量子化する。量子化部40001は最小の位置値とそれぞれのポイントの位置値との差に所定の量子スケール(quatization scale)値を掛けた後、切り下げ又は切り上げをして最も近い整数値を探す量子化動作を行う。従って、一つ又はそれ以上のポイントは同一の量子化された位置(又は位置値)を有することができる。実施例による量子化部40001は量子化されたポイントを再構成するために、量子化された位置に基づいてボクセル化(voxelization)を行う。2次元イメージ/ビデオ情報を含む最小単位はピクセル(pixel)のように、実施例によるポイントクラウドコンテンツ(又は3次元ポイントクラウドビデオ)のポイントは一つ又はそれ以上のボクセル(voxel)に含まれる。ボクセルはボリューム(Volume)とピクセル(Pixel)を組み合わせた言葉であり、3次元空間を表現する軸(例えば、X軸、Y軸、Z軸)に基づいて3次元空間をユニット(unit=1.0)単位で分けたときに発生する3次元キュービック空間を意味する。量子化部40001は3次元空間のポイントのグループをボクセルでマッチングする。実施例において、一つのボクセルは一つのポイントのみを含む。実施例において、一つのボクセルは一つ又はそれ以上のポイントを含む。また一つのボクセルを一つのポイントで表現するために、一つのボクセルに含まれた一つ又はそれ以上のポイントの位置に基づいて、該当ボクセルの中央点(ceter)の位置を設定することができる。この場合、一つのボクセルに含まれた全ての位置の特質が統合されて(combined)、該当ボクセルに割り当てられる。
【0051】
実施例による八分木分析部40002は、ボクセルを八分木構造で表すための八分木ジオメトリコーディング(又は八分木コーディング)を行う。八分木構造は八分割構造に基づいてボクセルにマッチングされたポイントを表現する。
【0052】
実施例による表面近似分析部40003は、八分木を分析して近似化する。実施例による八分木分析及び近似化は、八分木及びボクセル化を効率的に提供するために、多数のポイントを含む領域をボクセル化するために分析を行う過程である。
【0053】
実施例による演算エンコーダー40004は、八分木及び/又は近似化された八分木をエントロピー符号化する。例えば、符号化方式は演算(Arithmetic)符号化方法を含む。符号化の結果としてジオメトリビットストリームが生成される。
【0054】
色変換部40006、特質変換部40007、RAHT変換部40008、LOD生成部40009、リフト変換部40010、係数量子化部40011及び/又は演算エンコーダー40012は、特質符号化を行う。上述したように、一つのポイントは一つ又はそれ以上の特質を有する。実施例による特質符号化は、一つのポイントが有する特質に対して等しく適用される。但し、一つの特質(例えば、色相)が一つ又はそれ以上の要素を含む場合は、各要素ごとに独立した特質符号化が適用される。実施例による特質符号化は、色変換コーディング、特質変換コーディング、RAHT(Region Adaptive Hierarchial Transform)コーディング、予測変換(Interpolaration-based hierarchical nearest-neighbour prediction-Prediction Transform)コーディング及びリフト変換(interpolation-based hierarchical nearest-neighbour prediction with an update/lifting step(Lifting Transform))コーディングを含む。ポイントクラウドコンテンツによって、上述したRAHTコーディング、予測変換コーディング及びリフト変換コーディングが選択的に使用されるか、又は一つ又はそれ以上のコーディングの組み合わせが使用される。また実施例による特質符号化は上述した例示に限られない。
【0055】
実施例による色変換部40006は、特質に含まれた色値(又はテクスチャ)を変換する色変換コーディングを行う。例えば、色変換部40006は色相情報のフォーマットを変換(例えば、RGBからYCbCrに変換)する。実施例による色変換部40006の動作は、特質に含まれた色値によって任意に(optional)適用される。
【0056】
実施例によるジオメトリ再構成部40005は、八分木及び/又は近似化した八分木を再構成(復元)する。ジオメトリ再構成部40005はポイントの分布を分析した結果に基づいて八分木/ボクセルを再構成する。再構成された八分木/ボクセルは再構成されたジオメトリ(又は復元されたジオメトリ)とも呼ばれる。
【0057】
実施例による特質変換部40007は、ジオメトリ符号化が行われていない位置及び/又は再構成されたジオメトリに基づいて特質を変換する特質変換を行う。上述したように、特質はジオメトリに従属するので、特質変換部40007は再構成されたジオメトリ情報に基づいて特質を変換することができる。例えば、特質変換部40007は、ボクセルに含まれたポイントの位置値に基づいてその位置のポイントが有する特質を変換する。上述したように、一つのボクセルに含まれた一つ又はそれ以上のポイントの位置に基づいて該当ボクセルの中央点の位置が設定される場合、特質変換部40007は一つ又はそれ以上のポイントの特質を変換する。trisoupジオメトリ符号化が行われた場合、特質変換部40007はtrisoupジオメトリ符号化に基づいて特質を変換する。
【0058】
特質変換部40007は、各ボクセルの中央点の位置(又は位置値)から特定の位置/半径内に隣接しているポイントの特質又は特質値(例えば、各ポイントの色相、又は反射率など)の平均値を計算して特質変換を行う。特質変換部40007は平均値の計算時、中央点から各ポイントまでの距離による加重値を適用する。従って、各ボクセルは位置及び計算された特質(又は特質値)を有する。
【0059】
特質変換部40007はK-Dツリー又はモールトンコード(moulton code)に基づいて各ボクセルの中央点の位置から特定の位置/半径内に存在する隣接ポイントを探索する。K-Dツリーは二分探索木(binary search tree)で迅速に最短隣接点探索(Nearest Neighbor Search-NNS)をできるように、ポイントを位置基盤に管理する資料構造を支援する。モールトンコードは全てのポイントの3次元位置を示す座標値(例えば、(x、y、z))をビット値で示し、ビットを混ぜて生成される。例えば、ポイントの位置を示す座標値が(5、9、1)であると、座標値のビット値は(0101、1001、0001)である。ビット値をz、y、xの順にビットインデックスに合わせて混ぜると、010001000111である。この値を10進数で示すと1095になる。即ち、座標値が(5、9、1)であるポイントのモールトンコード値は1095である。特質変換部40007はモールトンコード値を基準としてポイントを整列し、depth-first traversal過程により最短隣接点探索(NNS)を行う。特質変換動作後、特質コーディングのための他の変換過程でも最短隣接点探索(NNS)が必要であれば、K-Dツリー又はモールトンコードが活用される。
【0060】
図示したように、変換された特質はRAHT変換部40008及び/又はLOD生成部40009に入力される。
【0061】
実施例によるRAHT変換部40008は、再構成されたジオメトリ情報に基づいて特質情報を予測するRAHTコーディングを行う。例えば、RAHT変換部40008は、八分木の下位レベルにあるノードに連関する特質情報に基づいて、八分木の上位レベルにあるノードの特質情報を予測することができる。
【0062】
実施例によるLOD生成部40009は予測変換コーディングを行うために、LOD(Level of Detail)を生成する。実施例によるLODはポイントクラウドコンテンツの詳細を示す程度であり、LOD値が小さいほどポイントクラウドコンテンツの詳細が下がり、LOD値が大きいほどポイントクラウドコンテンツの詳細が高いことを示す。ポイントをLODによって分類できる。
【0063】
実施例によるリフト変換部40010は、ポイントクラウドの特質を加重値に基づいて変換するリフト変換コーディングを行う。上述したように、リフト変換コーディングは選択的に適用される。
【0064】
実施例による係数量子化部40011は、特質符号化された特質を係数に基づいて量子化する。
【0065】
実施例による演算エンコーダー40012は、量子化された特質を演算コーディングに基づいて符号化する。
【0066】
図4のポイントクラウドエンコーダーのエレメントは、図示していないが、ポイントクラウド提供装置に含まれた一つ又はそれ以上のメモリと通信可能に設定された一つ又はそれ以上のプロセッサ又は集積回路(integrated circuits)を含むハードウェア、ソフトウェア、ファームウェア又はこれらの組み合わせで具現される。一つ又はそれ以上のプロセッサは、上述した図4のポイントクラウドエンコーダーのエレメントの動作及び/又は機能のうち、いずれか一つを行うことができる。また、一つ又はそれ以上のプロセッサは、図4のポイントクラウドエンコーダーのエレメントの動作及び/又は機能を行うためのソフトウェアプログラム及び/又は指示(instruction)のセットを動作又は実行することができる。実施例による一つ又はそれ以上のメモリは高速ランダムアクセスメモリを含むか、又は非揮発性メモリ(例えば、一つ又はそれ以上のマグネチックディスク格納デバイス、フラッシュメモリデバイス、又は他の非揮発性固体のメモリデバイス(Solid-state memory devices)など)を含む。
【0067】
図5は実施例によるボクセルの一例を示す図である。
【0068】
図5はX軸、Y軸、Z軸の3つの軸で構成された座標系で表現される3次元空間上に位置するボクセルを示す。図4に示すように、ポイントクラウドエンコーダー(例えば、量子化部40001など)はボクセル化を行う。ボクセルは3次元空間を表現する軸(例えば、X軸、Y軸、Z軸)に基づいて3次元空間をユニット(unit=1.0)単位で分けたときに発生する3次元キュービック空間を意味する。図5は2つの極点(0、0、0)及び(2、2、2)により定義される境界ボックス(cubical axis-aligned bounding box)を再帰的に分割(reculsive subdividing)する八分木構造により生成されたボクセルの一例を示す。一つのボクセルは少なくとも一つ以上のポイントを含む。ボクセルはボクセル群(voxel group)との位置関係から空間座標を推定することができる。上述したように、ボクセルは2次元イメージ/映像のピクセルと同様に、特質(色相又は反射率など)を有する。ボクセルに対する具体的な説明は図4で説明した通りであるので省略する。
【0069】
図6は実施例による八分木及び占有コード(occupancy code)の一例を示す図である。
【0070】
図1ないし図4に示したように、ポイントクラウドコンテンツ提供システム(ポイントクラウドビデオエンコーダー10002)又はポイントクラウドエンコーダー(例えば、八分木分析部40002)は、ボクセルの領域及び/又は位置を効率的に管理するために、八分木構造基盤の八分木ジオメトリコーディング(又は八分木コーディング)を行う。
【0071】
図6の上側は八分木構造を示している。実施例によるポイントクラウドコンテンツの3次元空間は座標系の軸(例えば、X軸、Y軸、Z軸)で表現される。八分木構造は2つの極点(0、0、0)及び(2、2、2)により定義される境界ボックス(cubical axis-aligned bounding box)を再帰的に分割(reculsive subdividing)して生される。2dはポイントクラウドコンテンツ(又はポイントクラウドビデオ)の全体ポイントを取り囲む最小の境界ボックスを構成する値で設定される。dは八分木の深さを示す。d値は以下の式により決定される。以下の式において、(xint 、yint 、zint )は量子化されたポイントの位置(又は位置値)を示す。
【0072】
【数1】
【0073】
図6の上側中央に示したように、分割によって全体3次元空間は8つの空間に分かれる。分割されたそれぞれの空間は6つの面を有するキューブで表現される。図6の右上側に示したように、8つの空間はそれぞれ再び座標系の軸(例えば、X軸、Y軸、Z軸)により分かれる。よって、それぞれの空間は再び8つの小さい空間に分かれる。分割された小さい空間も6つの面を有するキューブで表現される。このような分割方式は八分木のリーフノード(leaf node)がボクセルになるまで適用される。
【0074】
図6の下側は八分木の占有コードを示す。八分木の占有コードは一つの空間が分かれて発生する8つの分割空間がそれぞれ少なくとも一つのポイントを含むか否かを示すために生成される。従って、一つの占有コードは8つの子ノード(child node)で表現される。それぞれの子ノードは分割された空間の占有率(occupancy)を示し、子ノードは1ビットの値を有する。従って、占有コードは8ビットコードで表現される。即ち、子ノードに対応する空間に少なくとも一つのポイントが含まれていると、該当ノードは1値を有する。ノードに対応する空間にポイントが含まれていないと(empty)、該当ノードは0値を有する。図6に示した占有コードは00100001であるので、8つの子ノードのうち、3番目の子ノード及び8番目の子ノードに対応する空間はそれぞれ少なくとも一つのポイントを含むことを示している。図示したように、3番目の子ノード及び8番目の子ノードはそれぞれ8つの子ノードを有し、それぞれの子ノードは8ビットの占有コードで表現される。図面では、3番目の子ノードの占有コードが10000111であり、8番目の子ノードの占有コードが01001111であることを示す。実施例によるポイントクラウドエンコーダー(例えば、演算エンコーダー40004)は占有コードをエントロピー符号化する。また圧縮効率を高めるために、ポイントクラウドエンコーダーは占有コードをイントラ/インターコーディングする。実施例による受信装置(例えば、受信装置10004又はポイントクラウドビデオデコーダー10006)は占有コードに基づいて八分木を再構成する。
【0075】
実施例によるポイントクラウドエンコーダー(例えば、図4のポイントクラウドエンコーダー、又は八分木分析部40002)は、ポイントの位置を格納するためにボクセル化及び八分木コーディングを行う。しかし、3次元空間内のポイントがいつも均一に分布していることではないので、ポイントが多く存在しない特定の領域が存在し得る。従って、3次元空間の全体に対してボクセル化を行うことは非効率的である。例えば、特定の領域にポイントがほぼ存在しないと、該当領域までボクセル化を行う必要はない。
【0076】
従って、実施例によるポイントクラウドエンコーダーは、上述した特定の領域(又は八分木のリーフノードを除いたノード)についてはボクセル化を行わず、特定の領域に含まれたポイントの位置を直接コーディングするダイレクトコーディング(Direct coding)を行う。実施例によるダイレクトコーディングポイントの座標は、ダイレクトコーディングモード(Direct Coding Mode、DCM)と呼ばれる。また実施例によるポイントクラウドエンコーダーは、表面モデル(surface model)に基づいて特定の領域(又はノード)内のポイントの位置をボクセルに基づいて再構成するtrisoupジオメトリ符号化(Trisoup geometry encoding)を行うことができる。trisoupジオメトリ符号化はオブジェクトの表現を三角形メッシュ(triangle mesh)のシリーズで表現するジオメトリ符号化である。従って、ポイントクラウドデコーダーはメッシュ表面からポイントクラウドを生成することができる。実施例によるダイレクトコーディング及びtrisoupジオメトリ符号化は選択的に行われる。また実施例によるダイレクトコーディング及びtrisoupジオメトリ符号化は八分木ジオメトリコーディング(又は八分木コーディング)と結合して行うことができる。
【0077】
ダイレクトコーディング(Direct coding)を行うためには、ダイレクトコーディングを適用するための直接モード(direct mode)の使用オプションが活性化されている必要があり、ダイレクトコーディングを適用するノードはリーフノードではなく、特定のノード内に閾値(threshold)以下のポイントが存在する必要がある。またダイレクトコーディングの対象となる全体ポイントの個数は所定の閾値を超えてはいけない。上記条件を満たすと、実施例によるポイントクラウドエンコーダー(又は演算エンコーダー40004)はポイントの位置(又は位置値)をエントロピーコーディングすることができる。
【0078】
実施例によるポイントクラウドエンコーダー(例えば、表面近似分析部40003)は、八分木の特定のレベルを定め(レベルは八分木の深さdよりは小さい場合)、そのレベルからは表面モデルを使用してノード領域内のポイントの位置をボクセルに基づいて再構成するtrisoupジオメトリ符号化を行うことができる(trisoupモード)。実施例によるポイントクラウドエンコーダーは、trisoupジオメトリ符号化を適用するレベルを指定できる。例えば、指定されたレベルが八分木の深さと同一であると、ポイントクラウドエンコーダーはtrisoupモードで動作しない。即ち、実施例によるポイントクラウドエンコーダーは指定されたレベルが八分木の深さ値よりも小さい場合にのみtrisoupモードで動作することができる。実施例による指定されたレベルのノードの3次元立方体領域をブロック(block)と呼ぶ。一つのブロックは一つ又はそれ以上のボクセルを含む。ブロック又はボクセルはブリック(brick)に対応することもできる。それぞれのブロック内においてジオメトリは表面(surface)と表現される。実施例による表面は最大1回、ブロックの各エッジ(edge)と交差することができる。
【0079】
一つのブロックは12つのエッジを有するので、一つのブロック内に少なくとも12つの交差点が存在する。それぞれの交差点はバーテックス(vertex、頂点又は頂上)と呼ばれる。エッジに沿って存在するバーテックスは該当エッジを共有する全てのブロックのうち、そのエッジに隣接する少なくとも一つの占有ボクセル(occupied voxel)がある場合に検知される。実施例による占有ボクセルはポイントを含むボクセルを意味する。エッジに沿って検出されたバーテックスの位置は、該当エッジを共有する全てのブロックのうち、該当エッジに隣接する全てのボクセルのエッジによる平均位置である(the average position along the edge of all voxels)。
【0080】
バーテックスが検出されると、実施例によるポイントクラウドエンコーダーは、エッジの開始点(x、y、z)、エッジの方向ベクトル(Δx、Δy、Δz)、バーテックス位置値(エッジ内の相対的位置値)をエントロピーコーディングする。trisoupジオメトリ符号化が適用された場合、実施例によるポイントクラウドエンコーダー(例えば、ジオメトリ再構成部40005)は、三角形再構成(triangle reconstruction)、アップ-サンプリング(up-sampling)、ボクセル化過程を行って復元されたジオメトリ(再構成されたジオメトリ)を生成する。
【0081】
ブロックのエッジに位置するバーテックスはブロックを通過する表面を決定する。実施例による表面は非平面多角形である。三角形再構成の過程ではエッジの開始点、エッジの方向ベクトルとバーテックスの位置値に基づいて三角形で示される表面を再構成する。三角形再構成の過程は以下の通りである。丸1(1)各バーテックスの中心(centroid)値を計算し、丸2(2)各バーテックスの値から中心値を引いた値に丸3(3)自乗を行っって、その値を全て併せた値を得る。
【0082】
【数2】
【0083】
加えられた値の最小値を求め、最小値がある軸に沿って投影(Projection)過程を行う。例えば、x要素(element)が最小である場合、各バーテックスをブロックの中心を基準としてx軸に投影し、(y、z)平面に投影させる。(y、z)平面に投影させて得た値が(ai、bi)であれば、atan2(bi、ai)によりθ値を求め、θ値を基準としてバーテックスを整列する。以下の表はバーテックスの個数によって三角形を生成するためのバーテックスの組み合わせを示している。バーテックスは1からnまで順に整列される。以下の表は4つのバーテックスに対して、バーテックスの組み合わせによって2つの三角形が構成されることを示している。1番目の三角形は整列されたバーテックスのうち、1、2、3番目のバーテックスで構成され、2番目の三角形は整列されたバーテックスのうち、3,4,1番目のバーテックスで構成される。
【0084】
表2-1.Triangles formed from vertices ordered 1,…,n
【0085】
n triangles
【0086】
3(1,2,3)
【0087】
4(1,2,3), (3,4,1)
【0088】
5(1,2,3), (3,4,5), (5,1,3)
【0089】
6(1,2,3), (3,4,5), (5,6,1), (1,3,5)
【0090】
7(1,2,3), (3,4,5), (5,6,7), (7,1,3), (3,5,7)
【0091】
8(1,2,3), (3,4,5), (5,6,7), (7,8,1), (1,3,5), (5,7,1)
【0092】
9(1,2,3), (3,4,5), (5,6,7), (7,8,9), (9,1,3), (3,5,7), (7,9,3)
【0093】
10(1,2,3), (3,4,5), (5,6,7), (7,8,9), (9,10,1), (1,3,5), (5,7,9), (9,1,5)
【0094】
11(1,2,3), (3,4,5), (5,6,7), (7,8,9), (9,10,11), (11,1,3), (3,5,7), (7,9,11), (11,3,7)
【0095】
12(1,2,3), (3,4,5), (5,6,7), (7,8,9), (9,10,11), (11,12,1), (1,3,5), (5,7,9), (9,11,1), (1,5,9)
【0096】
アップサンプリング過程は三角形のエッジに沿って中間に点を追加してボクセル化するために行われる。アップサンプリング係数(upsampling factor)とブロックの幅を基準として追加点を生成する。追加点はリファインドバーテックス(refined vertice)と呼ばれる。実施例によるポイントクラウドエンコーダーはリファインドバーテックスをボクセル化することができる。またポイントクラウドエンコーダーはボクセル化された位置(又は位置値)に基づいて特質符号化を行うことができる。
【0097】
図7は実施例による隣接ノードパターンの一例を示す図である。
【0098】
ポイントクラウドビデオの圧縮効率を増加させるために、実施例によるポイントクラウドエンコーダーはコンテキスト適応演算(context adaptive arithmetic)コーディングに基づいてエントロピーコーディングを行う。
【0099】
図1ないし図6で説明したように、ポイントクラウドコンテンツ提供システム又はポイントクラウドエンコーダー(例えば、ポイントクラウドビデオエンコーダー10002、図4のポイントクラウドエンコーダー又は演算エンコーダー40004)は、占有コードをすぐエントロピーコーディングする。またポイントクラウドコンテンツ提供システム又はポイントクラウドエンコーダーは、現在ノードの占有コードと隣接ノードの占有率に基づいてエントロピー符号化(イントラ符号化)を行うか、又は以前フレームの占有コードに基づいてエントロピー符号化(インター符号化)を行う。実施例によるフレームは、同時間に生成されたポイントクラウドビデオの集合を意味する。実施例によるイントラ符号化/インター符号化の圧縮効率は、参照する隣接ノードの個数によって異なる。ビットが大きくなると複雑になるが、一側に傾くようにして圧縮効率を高めることができる。例えば、3-bit contextを有すると、2の3乗である8つの方法でコーディングする。分けてコーディングする部分は具現の複雑度に影響を及ぼす。従って、圧縮効率と複雑度の適正水準を合わせる必要がある。
【0100】
図7は隣接ノードの占有率に基づいて占有パターンを求める過程を示す。実施例によるポイントクラウドエンコーダーは、八分木の各ノードの隣接ノードの占有率(occupancy)を判断して隣接ノードパターン(neighbor pattern)値を得る。隣接ノードパターンは該当ノードの占有パターンを推論するために使用される。図7の左側はノードに対応するキューブ(真ん中に位置するキューブ)及び該当キューブと少なくとも一面を共有する6つのキューブ(隣接ノード)を示している。図示したノードは同じ深さのノードである。図示した数字は6つのノードとそれぞれ連関する加重値(1、2、4、8、16、32、など)を示す。各加重値は隣接ノードの位置によって順に付与される。
【0101】
図7の右側は隣接ノードパターン値を示す。隣接ノードパターン値は占有された隣接ノード(ポイントを有する隣接ノード)の加重値が掛けられた値の合計である。従って、隣接ノードパターン値は0から63までの値を有する。隣接ノードパターン値が0であることは、該当ノードの隣接ノードのうち、ポイントを有するノード(占有ノード)がないことを意味する。隣接ノードパターン値が63であることは、隣接ノードが全て占有ノードであることを意味する。図示したように、加重値1、2、4、8が付与された隣接ノードは占有ノードであるので、隣接ノードパターン値は1、2、4、8を併せた値である15である。ポイントクラウドエンコーダーは隣接ノードパターン値によってコーディングを行うことができる(例えば、隣接ノードパターン値が63である場合、64つのコーディングを行う)。実施例においてポイントクラウドエンコーダーは隣接ノードパターン値を変更して(例えば、64を10又は6に変更するテーブルに基づく)、コーディングの複雑度を減らすことができる。
【0102】
図8は実施例によるLODごとのポイント構成の一例を示す図である。
【0103】
図1ないし図7で説明したように、特質符号化が行われる前、符号化されたジオメトリは再構成(復元)される。ダイレクトコーディングが適用された場合、ジオメトリ再構成の動作はダイレクトコーディングされたポイントの配置を変更することを含む(例えば、ダイレクトコーディングされたポイントをポイントクラウドデータの前方に配置)。trisoupジオメトリ符号化が適用された場合、ジオメトリ再構成の過程は三角形再構成、アップサンプリング、ボクセル化の過程を特質はジオメトリに従属するので、特質符号化は再構成されたジオメトリに基づいて行われる。
【0104】
ポイントクラウドエンコーダー(例えば、LOD生成部40009)はポイントをLODごとに分類する(reorganization)。図面はLODに対応するポイントクラウドコンテンツを示す。図において左側はオリジナルポイントクラウドコンテンツを示す。図において左側から2番目は最低LODのポイントの分布を示し、最右側は最高LODのポイントの分布を示す。即ち、最低LODのポイントは粗い(sparse)分布であり、最高LODのポイントは細かい分布である。即ち、図面の下側に示された矢印方向に沿ってLODが増加するほどポイント間の間隔(又は距離)は短くなる。
【0105】
図9は実施例によるLODごとのポイント構成の一例を示す図である。
【0106】
図1ないし図8で説明したように、ポイントクラウドコンテンツ提供システム又はポイントクラウドエンコーダー(例えば、ポイントクラウドビデオエンコーダー10002、図4のポイントクラウドエンコーダー又はLOD生成部40009)はLODを生成する。LODはポイントを設定されたLOD距離値(又はユークリッド距離(Euclidean Distance)のセット)によって改良レベル(refinement levels)のセットで再整列して生成される。LOD生成過程はポイントクラウドエンコーダーだけではなく、ポイントクラウドデコーダーでも行われる。
【0107】
図9の上側は3次元空間に分布されたポイントクラウドコンテンツのポイントの一例(P0~P9)を示す。図9のオリジナルオーダー(Original order)はLOD生成前のポイントP0~P9の順を示す。図9のLoD基盤のオーダー(LOD based order)はLOD生成によるポイントの順を示す。ポイントはLODごとに再整列される。また高いLODは低いLODに属するポイントを含む。図9に示すように、LOD0はP0、P5、P4及びP2を含む。LOD1はLOD0のポイントとP1、P6及びP3を含む。LOD2はLOD0のポイント、LOD1のポイント及びP9、P8及びP7を含む。
【0108】
図4で説明したように、実施例によるポイントクラウドエンコーダーは予測変換コーディング、リフト変換コーディング及びRAHT変換コーディングを選択的に又は組み合わせて行うことができる。
【0109】
実施例によるポイントクラウドエンコーダーは、ポイントに対する予測機(predictor)を生成して各ポイントの予測特質(又は予測特質値)を設定するための予測変換コーディングを行う。即ち、N個のポイントに対してN個の予測機が生成される。実施例による予測機は各ポイントのLOD値とLODごとに設定された距離内に存在する隣接ポイントに対するインデックス情報及び隣接ポイントまでの距離値に基づいて加重値(=1/距離)を計算することができる。
【0110】
実施例による予測特質(又は特質値)は、各ポイントの予測機に設定された隣接ポイントの特質(又は特質値、例えば、色相、反射率など)に各隣接ポイントまでの距離に基づいて計算された加重(又は加重値)を掛けた値の平均値で設定される。実施例によるポイントクラウドエンコーダー(例えば、係数量子化部40011)は、各ポイントの特質(特質値)から予測特質(特質値)を引いた残余値(residuals、残余特質、残余特質値、特質予測残余値などとも呼ばれる)を量子化(quatization)及び逆量子化(inverse quantization)することができる。量子化過程は以下の表の通りである。
【0111】
表.Attribute prediction residuals quantization pseudo code
【0112】
int PCCQuantization(int value, int quantStep) {
【0113】
if( value >=0) {
【0114】
return floor(value / quantStep + 1.0 / 3.0);
【0115】
} else {
【0116】
return -floor(-value / quantStep + 1.0 / 3.0);
【0117】
【0118】
【0119】
Attribute prediction residuals inverse quantization pseudo code
【0120】
int PCCInverseQuantization (int value, int quantStep) {
【0121】
if(quantStep ==0) {
【0122】
return value;
【0123】
} else {
【0124】
return value* quantStep;
【0125】
【0126】
【0127】
実施例によるポイントクラウドエンコーダー(例えば、演算エンコーダー40012)は、各ポイントの予測機に隣接するポイントがあれば、上述したように、量子化及び逆量子化された残余値をエントロピーコーディングする。実施例によるポイントクラウドエンコーダー(例えば、演算エンコーダー40012)は、各ポイントの予測機に隣接するポイントがないと、上述した過程を行わず、該当ポイントの特質をエントロピーコーディングする。
【0128】
実施例によるポイントクラウドエンコーダー(例えば、リフト変換部40010)は、各ポイントの予測機を生成し、予測機に計算されたLODを設定及び隣接ポイントを登録し、隣接ポイントまでの距離による加重値を設定してリフト変換コーディングを行う。実施例によるリフト変換コーディングは、上述した測変換コーディングと類似するが、特質値に加重値を累積適用するという点で差がある。実施例による特質値に加重値を累積適用する過程は以下の通りである。
【0129】
1)各ポイントの加重値を貯蔵する配列QW(QuantizationWieght)を生成する。QWの全ての要素の初期値は1.0である。予測機に登録された隣接ノードの予測機インデックスのQW値に現在ポイントの予測機の加重値を掛けた値を加える。
【0130】
2)リフト予測過程:予測された特質値を計算するために、ポイントの特質値に加重値を掛けた値を既存の特質値から引く。
【0131】
3)アップデートウェイト(updateweight)及びアップデートという臨時配列を生成し、臨時配列を0に初期化する。
【0132】
4)全ての予測機に対して計算された加重値に予測機インデックスに該当するQWに貯蔵された加重値をさらに掛けて算出された加重値をアップデートウェイト配列に隣接ノードのインデックスとして累積して合算する。アップデート配列には隣接ノードのインデックスの特質値に算出された加重値を掛けた値を累積して合算する。
【0133】
5)リフトアップデート過程:全ての予測機に対して、アップデート配列の特質値を予測機インデックスのアップデートウェイト配列の加重値で割り、割った値に再び既存の特質値を加える。
【0134】
6)全ての予測機に対して、リフトアップデート過程でアップデートされた特質値にリフト予測過程でアップデートされた(QWに貯蔵された)加重値をさらに掛けて予測特質値を算出する。実施例によるポイントクラウドエンコーダー(例えば、係数量子化部40011)は予測特質値を量子化する。またポイントクラウドエンコーダー(例えば、演算エンコーダー40012)は量子化された特質値をエントロピーコーディングする。
【0135】
実施例によるポイントクラウドエンコーダー(例えば、RAHT変換部40008)は、八分木の下位レベルのノードに連関する特質を使用して上位レベルのノードの特質を予測するRAHT変換コーディングを行う。RAHT変換コーディングは八分木バックワードスキャンによる特質イントラコーディングの一例である。実施例によるポイントクラウドエンコーダーは、ボクセルから全体領域にスキャンし、各ステップもまた、ボクセルをもっと大きいブロックに合わせながらルートノード(root node)までの併合過程を繰り返して行う。実施例による併合過程は、占有ノードのみについて行われる。空ノード(empty node)については併合過程が行われず、空ノードの直上位ノードについて併合過程が行われる。
【0136】
【表1】
【0137】
図10は実施例によるポイントクラウドデコーダー(Point Cloud Decoder)の一例を示す図である。
【0138】
図10に示したポイントクラウドデコーダーは、図1に示したポイントクラウドビデオデコーダー10006の一例であり、図1で説明したイントクラウドビデオデコーダー10006の動作などと同一又は類似する動作を行う。図示したように、ポイントクラウドデコーダーは一つ又はそれ以上のビットストリーム(bitstream)に含まれたジオメトリビットストリーム(geometry bitstream)及び特質ビットストリーム(Attribute bitstream)を受信する。ポイントクラウドデコーダーはジオメトリデコーダー(geometry decoder)及び特質デコーダー(Attribute decoder)を含む。ジオメトリデコーダーはジオメトリビットストリームに対してジオメトリ復号を行って復号されたジオメトリ(decoded geometry)を出力する。特質デコーダーは復号されたジオメトリ及び特質ビットストリームに基づいて特質復号を行って復号された特質(decoded Attributes)を出力する。復号されたジオメトリ及び復号された特質はポイントクラウドコンテンツを復元(decoded point cloud)するために使用される。
【0139】
図11は実施例によるポイントクラウドデコーダー(Point Cloud Decoder)の一例を示す図である。
【0140】
図11に示したポイントクラウドデコーダーは図10で説明したポイントクラウドデコーダーの一例であり、図1ないし図9で説明したポイントクラウドエンコーダーの符号化動作の逆過程である復号動作を行う。
【0141】
図1及び図10で説明したように、ポイントクラウドデコーダーはジオメトリ復号及び特質復号を行う。ジオメトリ復号は特質復号よりも先に行われる。
【0142】
実施例によるポイントクラウドデコーダーは、演算デコーダー(arithmetic decode)11000、八分木合成部(synthesize octree)11001、表面近似合成部(synthesize surface approximation)11002、ジオメトリ再構成部(reconstruct geometry)11003、座標系逆変換部(inverse transform coordinates)11004、演算デコーダー(arithmetic decode)11005、逆量子化部(inverse quantize)11006、RAHT変換部11007、LOD生成部(generate LOD)11008、逆リフト部(Inverse lifting)11009及び/又は色逆変換部(inverse transform colors)11010を含む。
【0143】
演算デコーダー11000、八分木合成部11001、表面近似合成部11002、ジオメトリ再構成部11003及び座標系逆変換部11004はジオメトリ復号を行う。実施例によるジオメトリ復号はダイレクトコーディング(direct coding)及びtrisoupジオメトリ復号(trisoup geometry decoding)を含む。ダイレクトコーディング及びtrisoupジオメトリ復号は選択的に適用される。またジオメトリ復号は上記の例示に限られず、図1ないし図9で説明したジオメトリ符号化の逆過程で行われる。
【0144】
実施例による演算デコーダー11000は、受信したジオメトリビットストリームを演算コーディングに基づいて復号する。演算デコーダー11000の動作は演算エンコーダー40004の逆過程に対応する。
【0145】
実施例による八分木合成部11001は、復号されたジオメトリビットストリームから(又は復号結果、確保されたジオメトリに関する情報)から占有コードを獲得して八分木を生成する。占有コードに関する具体的な説明は図1ないし図9に説明した通りである。
【0146】
実施例による表面近似合成部11002は、trisoupジオメトリ符号化が適用された場合、復号されたジオメトリ及び/又は生成された八分木に基づいて表面を合成する。
【0147】
実施例によるジオメトリ再構成部11003は、表面及び/又は復号されたジオメトリに基づいてジオメトリを再生成する。図1ないし図9で説明したように、ダイレクトコーディング及びtrisoupジオメトリ符号化は選択的に適用される。従って、ジオメトリ再構成部11003はダイレクトコーディングが適用されたポイントの位置情報を直接持ってきて追加する。また、trisoupジオメトリ符号化が適用される場合、ジオメトリ再構成部11003はジオメトリ再構成部40005の再構成動作、例えば、三角形再構成、アップサンプリング、ボクセル化動作を行ってジオメトリを復元する。具体的な内容は図6で説明した通りであるので省略する。復元されたジオメトリは特質を含まないポイントクラウドピクチャ又はフレームを含む。
【0148】
実施例による座標系逆変換部11004は復元されたジオメトリに基づいて座標系を変換してポイントの位置を得る。
【0149】
演算デコーダー11005、逆量子化部11006、RAHT変換部11007、LOD生成部11008、逆リフト部11009及び/又は色逆変換部11010は、図10で説明した特質復号を行う。実施例による特質復号は、RAHT(Region Adaptive Hierarchial Transform)復号、予測変換(Interpolaration-based hierarchical nearest-neighbour prediction-Prediction Transform)復号、及びリフト変換(interpolation-based hierarchical nearest-neighbour prediction with an update/lifting step(Lifting Transform))復号を含む。上記3つの復号は選択的に使用されるか、又は一つ又はそれ以上の復号の組み合わせが使用される。また実施例による特質復号は上述した例示に限られない。
【0150】
実施例による演算デコーダー11005は、特質ビットストリームを演算コーディングに復号する。
【0151】
実施例による逆量子化部11006は、復号された特質ビットストリーム又は復号結果確保した特質に関する情報を逆量子化(inverse quantization)して、逆量子化された特質(又は特質値)を出力する。逆量子化はポイントクラウドエンコーダーの特質符号化に基づいて選択的に適用される。
【0152】
実施例においてRAHT変換部11007、LOD生成部11008及び/又は逆リフト部11009は、再構成されたジオメトリ及び逆量子化された特質を処理する。上述したように、RAHT変換部11007、LOD生成部11008及び/又は逆リフト部11009は、ポイントクラウドエンコーダーの符号化によってそれに対応する復号動作を選択的に行う。
【0153】
実施例による色逆変換部11010は、復号された特質に含まれた色値(又はテクスチャ)を逆変換するための逆変換コーディングを行う。色逆変換部11010の動作はポイントクラウドエンコーダーの色変換部40006の動作に基づいて選択的に行われる。
【0154】
図11のポイントクラウドデコーダーのエレメントは、図示していないが、ポイントクラウド提供装置に含まれた一つ又はそれ以上のメモリと通信可能に設定された一つ又はそれ以上のプロセッサ又は集積回路(integrated circuits)を含むハードウェア、ソフトウェア、ファームウェア又はこれらの組み合わせで具現される。一つ又はそれ以上のプロセッサは、上述した図11のポイントクラウドデコーダーのエレメント動作及び/又は機能のうちのいずれかを行う。また、一つ又はそれ以上のプロセッサは、図11のポイントクラウドデコーダーのエレメントの動作及び/又は機能を行うためのソフトウェアプログラム及び/又は指示(instruction)のセットを動作又は実行する。
【0155】
図12は実施例による送信装置の一例を示す。
【0156】
図12に示した送信装置は、図1の送信装置10000(又は図4のポイントクラウドエンコーダー)の一例である。図12に示した送信装置は、図1ないし図9で説明したポイントクラウドエンコーダーの動作及び符号化方法と同一又は類似する動作及び方法のうちのいずれかを行う。実施例による送信装置は、データ入力部12000、量子化処理部12001、ボクセル化処理部12002、八分木占有コード生成部12003、表面モデル処理部12004、イントラ/インターコーディング処理部12005、演算コーダー12006、メタデータ処理部12007、色相変換処理部12008、特質変換処理部(又は属性変換処理部)12009、予測/リフト/RAHT変換処理部12010、演算コーダー12011及び/又は送信処理部12012を含む。
【0157】
実施例によるデータ入力部12000はポイントクラウドデータを受信又は獲得する。データ入力部12000はポイントクラウドビデオ獲得部10001の動作及び/又は獲得方法(又は図2に示した獲得過程20000)と同一又は類似する動作及び/又は獲得方法を行う。
【0158】
データ入力部12000、量子化処理部12001、ボクセル化処理部12002、八分木占有コード生成部12003、表面モデル処理部12004、イントラ/インターコーディング処理部12005及び演算コーダー12006はジオメトリ符号化を行う。実施例によるジオメトリ符号化は、図1ないし図9で説明したジオメトリ符号化と同一又は類似するので、具体的な説明は省略する。
【0159】
実施例による量子化処理部12001は、ジオメトリ(例えば、ポイントの位置値、又はポジション値)を量子化する。量子化処理部12001の動作及び/又は量子化は、図4に示した量子化部40001の動作及び/又は量子化と同一又は類似する。具体的な説明は図1ないし図9に説明した通りである。
【0160】
実施例によるボクセル化処理部12002は、量子化されたポイントの位置値をボクセル化する。ボクセル化処理部120002は図4に示した量子化部40001の動作及び/又はボクセル化過程と同一又は類似する動作及び/又は過程を行う。具体的な説明は図1ないし図9に説明した通りである。
【0161】
実施例による八分木占有コード生成部12003は、ボクセル化されたポイントの位置を八分木構造に基づいて八分木コーディングを行う。八分木占有コード生成部12003は占有コードを生成する。八分木占有コード生成部12003は図4及び図6で説明したポイントクラウドエンコーダー(又は八分木分析部40002)の動作及び/又は方法と同一又は類似する動作及び/又は方法を行う。具体的な説明は図1ないし図9に説明した通りである。
【0162】
実施例による表面モデル処理部12004は、表面モデル(surface model)に基づいて特定の領域(又はノード)内のポイントの位置をボクセル基盤に再構成するtrisoupジオメトリ符号化を行う。表面モデル処理部12004は図4に示したポイントクラウドエンコーダー(例えば、表面近似分析部40003)の動作及び/又は方法と同一又は類似する動作及び/又は方法を行う。具体的な説明は図1ないし図9に説明した通りである。
【0163】
実施例によるイントラ/インターコーディング処理部12005は、ポイントクラウドデータをイントラ/インターコーディングする。イントラ/インターコーディング処理部12005は、図7で説明したイントラ/インターコーディングと同一又は類似するコーディングを行う。具体的な説明は図7に説明した通りである。実施例においてイントラ/インターコーディング処理部12005は演算コーダー12006に含まれる。
【0164】
実施例による演算コーダー12006は、ポイントクラウドデータの八分木及び/又は近似化された八分木をエントロピー符号化する。例えば、符号化方式は演算(Arithmetic)符号化方法を含む。演算コーダー12006は演算エンコーダー40004の動作及び/又は方法と同一又は類似する動作及び/又は方法を行う。
【0165】
実施例によるメタデータ処理部12007は、ポイントクラウドデータに関するメタデータ、例えば、設定値などを処理してジオメトリ符号化及び/又は特質符号化などの必要な処理過程に提供する。また実施例によるメタデータ処理部12007は、ジオメトリ符号化及び/又は特質符号化に関連するシグナリング情報を生成及び/又は処理する。実施例によるシグナリング情報はジオメトリ符号化及び/又は特質符号化とは別途に符号化処理される。また実施例によるシグナリング情報はインターリービングされることもある。
【0166】
色相変換処理部12008、特質変換処理部12009、予測/リフト/RAHT変換処理部12010及び演算コーダー12011は特質符号化を行う。実施例による特質符号化は、図1ないし図9で説明した特質符号化と同一又は類似するので具体的な説明は省略する。
【0167】
実施例による色相変換処理部12008は、特質に含まれた色相値を変換する色相変換コーディングを行う。色相変換処理部12008は再構成されたジオメトリに基づいて色相変換コーディングを行う。再構成されたジオメトリに関する説明は、図1ないし図9に説明した通りである。また図4で説明した色変換部40006の動作及び/又は方法と同一又は類似する動作及び/又は方法を行う。具体的な説明は省略する。
【0168】
実施例による特質変換処理部12009は、ジオメトリ符号化が行われていない位置及び/又は再構成されたジオメトリに基づいて特質を変換する特質変換を行う。特質変換処理部12009は図4に説明した特質変換部40007の動作及び/又は方法と同一又は類似する動作及び/又は方法を行う。具体的な説明は省略する。実施例による予測/リフト/RAHT変換処理部12010は変換された特質をRAHTコーディング、予測変換コーディング及びリフト変換コーディングのうちのいずれか一つ又は組み合わせてコーディングする。予測/リフト/RAHT変換処理部12010は図4に説明したRAHT変換部40008、LOD生成部40009及びリフト変換部40010の動作と同一又は類似する動作のうちのいずれかを行う。また、予測変換コーディング、リフト変換コーディング及びRAHT変換コーディングに関する説明は図1ないし図9に説明した通りであるので、具体的な説明は省略する。
【0169】
実施例による演算コーダー12011は、符号化された特質を演算コーディングに基づいて符号化する。演算コーダー12011は演算エンコーダー400012の動作及び/又は方法と同一又は類似する動作及び/又は方法を行う。
【0170】
実施例による送信処理部12012は、符号化されたジオメトリ及び/又は符号化された特質、メタデータ情報を含む各ビットストリームを送信するか、又は符号化されたジオメトリ及び/又は符号化された特質、メタデータ情報を一つのビットストリームで構成して送信する。実施例による符号化されたジオメトリ及び/又は符号化された特質、メタデータ情報が一つのビットストリームで構成された場合、ビットストリームは一つ又はそれ以上のサブビットストリームを含む。実施例によるビットストリームはシーケンスレベルのシグナリングのためのSPS(Sequence Parameter Set)、ジオメトリ情報コーディングのシグナリングのためのGPS(Geometry Parameter Set)、特質情報コーディングのシグナリングのためのAPS(Attribute Parameter Set)、タイルレベルのシグナリングのためのTPS(Tile Parameter Set)を含むシグナリング情報及びスライスデータを含む。スライスデータは一つ又はそれ以上のスライスに関する情報を含む。実施例による一つのスライスは一つのジオメトリビットストリーム(Geom0)及び一つ又はそれ以上の特質ビットストリーム(Attr0、Attr1)を含む。
【0171】
スライス(slice)とは、符号化されたポイントクラウドフレームの全体又は一部を示すシンタックスエレメントのシリーズをいう。
【0172】
実施例によるTPSは一つ又はそれ以上のタイルに対してそれぞれのタイルに関する情報(例えば、bounding boxの座標値情報及び高さ/サイズ情報など)を含む。ジオメトリビットストリームはヘッダとペイロードを含む。実施例によるジオメトリビットストリームのヘッダはGPSに含まれたパラメータセットの識別情報(geom_parameter_set_id)、タイル識別子(geom_tile_id)、スライス識別子(geom_slice_id)及びペイロードに含まれたデータに関する情報などを含む。上述したように、実施例によるメタデータ処理部12007はシグナリング情報を生成及び/又は処理して送信処理部12012に送信することができる。実施例において、ジオメトリ符号化を行うエレメント及び特質符号化を行うエレメントは、点線処理したように、相互データ/情報を共有することができる。実施例による送信処理部12012は送信機10003の動作及び/又は送信方法と同一又は類似する動作及び/又は送信方法を行う。具体的な説明は図1及び図2に説明した通りであるので、省略する。
【0173】
図13は実施例による受信装置の一例を示す。
【0174】
図13に示した受信装置は、図1の受信装置10004(又は図10及び図11のポイントクラウドデコーダー)の一例である。図13に示した受信装置は、図1ないし図11で説明したポイントクラウドデコーダーの動作及び復号方法と同一又は類似する動作及び方法のうちのいずれかを行う。
【0175】
実施例による受信装置は、受信部13000、受信処理部13001、演算(arithmetic)デコーダー13002、占有コード(Occupancy code)基盤の八分木再構成処理部13003、表面モデル処理部(三角形再構成、アップサンプリング、ボクセル化)13004、逆(inverse)量子化処理部13005、メタデータパーサ13006、演算(arithmetic)デコーダー13007、逆量子化処理部13008、予測/リフト/RAHT逆変換処理部13009、色相逆変換処理部13010及び/又はレンダラー13011を含む。実施例による復号の各構成要素は実施例による符号化の構成要素の逆過程を行う。
【0176】
実施例による受信部13000は、ポイントクラウドデータを受信する。受信部13000は図1の受信機10005の動作及び/又は受信方法と同一又は類似する動作及び/又は受信方法を行う。具体的な説明は省略する。
【0177】
実施例による受信処理部13001は受信したデータからジオメトリビットストリーム及び/又は特質ビットストリームを得る。受信処理部13001は受信部13000に含まれる。
【0178】
演算デコーダー13002、占有コード基盤の八分木再構成処理部13003、表面モデル処理部13004及び逆量子化処理部13005はジオメトリ復号を行う。実施例によるジオメトリ復号は図1ないし図10で説明したジオメトリ復号と同一又は類似するので、具体的な説明は省略する。
【0179】
実施例による演算デコーダー13002はジオメトリビットストリームを演算コーディングに基づいて復号する。演算デコーダー13002は演算デコーダー11000の動作及び/又はコーディングと同一又は類似する動作及び/又はコーディングを行う。
【0180】
実施例による占有コード基盤の八分木再構成処理部13003は、復号されたジオメトリビットストリームから(又は復号結果、確保されたジオメトリに関する情報)から占有コードを獲得して八分木を再構成する。占有コード基盤の八分木再構成処理部13003は、八分木合成部11001の動作及び/又は八分木生成方法と同一又は類似する動作及び/又は方法を行う。実施例による表面モデル処理部13004はtrisoupジオメトリ符号化が適用された場合、表面モデル方式に基づいてtrisoupジオメトリ復号及びそれに関連するジオメトリ再構成(例えば、三角形再構成、アップサンプリング、ボクセル化)を行う。表面モデル処理部13004は表面近似合成部11002及び/又はジオメトリ再構成部11003の動作と同一又は類似する動作を行う。
【0181】
実施例による逆量子化処理部13005は復号されたジオメトリを逆量子化する。
【0182】
実施例によるメタデータパーサ13006は受信したポイントクラウドデータに含まれたメタデータ、例えば、設定値などを分析する。メタデータパーサ13006はメタデータをジオメトリ復号及び/又は特質復号に伝達する。メタデータに関する具体的な説明は図12で説明した通りであるので省略する。
【0183】
演算デコーダー13007、逆量子化処理部13008、予測/リフト/RAHT逆変換処理部13009及び色相逆変換処理部13010は特質復号を行う。特質復号は図1なしい図10で説明した特質復号と同一又は類似するので、具体的な説明は省略する。
【0184】
実施例による演算デコーダー13007は、特質ビットストリームを演算コーディングに復号する。演算デコーダー13007は再構成されたジオメトリに基づいて特質ビットストリームの復号を行う。演算デコーダー13007は演算デコーダー11005の動作及び/又はコーディングと同一又は類似する動作及び/又はコーディングを行う。
【0185】
実施例による逆量子化処理部13008は、復号された特質ビットストリームを逆量子化する。逆量子化処理部13008は逆量子化部11006の動作及び/又は逆量子化方法と同一又は類似する動作及び/又は方法を行う。
【0186】
実施例による予測/リフト/RAHT逆変換処理部13009は、再構成されたジオメトリ及び逆量子化された特質を処理する。予測/リフト/RAHT逆変換処理部13009は、RAHT変換部11007、LOD生成部11008及び/又は逆リフト部11009の動作及び/又は復号と同一又は類似する動作及び/又は復号のうちのいずれかを行う。実施例による色相逆変換処理部13010は、復号された特質に含まれた色値(又はテクスチャ)を逆変換するための逆変換コーディングを行う。色相逆変換処理部13010は色逆変換部11010の動作及び/又は逆変換コーディングと同一又は類似する動作及び/又は逆変換コーディングを行う。実施例によるレンダラー13011はポイントクラウドデータをレンダリングする。
【0187】
図14は実施例によるポイントクラウドデータの送受信方法/装置に連動可能な構造の一例を示す図である。
【0188】
図14の構造はサーバー1460、ロボット1410、自律走行車両1420、XR装置1430、スマートフォン1440、家電1450及び/又はHMD1470のうちのいずれかがクラウドネットワーク1410に連結された構成を示している。ロボット1410、自律走行車両1420、XR装置1430、スマートフォン1440又は家電1450などは装置とも呼ばれる。またXR装置1430は実施例によるポイントクラウドデータ(PCC)装置に対応するか又はPCC装置に連動する。
【0189】
クラウドネットワーク1400はクラウドコンピューティングインフラの一部を構成するか、又はクラウドコンピューティングインフラ内に存在するネットワークを意味する。ここで、クラウドネットワーク1400は3Gネットワーク、4G又はLTEネットワーク又は5Gネットワークなどを用いて構成される。
【0190】
サーバー1460はロボット1410、自律走行車両1420、XR装置1430、スマートフォン1440、家電1450及び/又はHMD1470のいずれかにクラウドネットワーク1400により連結され、連結された装置1410~1470のプロセシングの少なくとも一部を助けることができる。
【0191】
HMD(Head-Mount Display)1470は実施例によるXRデバイス及び/又はPCCデバイスが具現されるタイプのうちのいずれかを示す。実施例によるHMDタイプのデバイスは、コミュニケーションズユニット、コントロールユニット、メモリユニット、I/Oユニット、センサユニット及びパワー供給ユニットなどを含む。
【0192】
以下、上記技術が適用される装置1410~1450の様々な実施例について説明する。ここで、図14に示した装置1410~1450は上述した実施例によるポイントクラウドデータ送受信装置に連動/結合することができる。
【0193】
<PCC+XR>
【0194】
XR/PCC装置1430はPCC及び/又はXR(AR+VR)技術が適用されて、HMD(Head-Mount Display)、車両に備えられたHUD(Head-Up Display)、TV、携帯電話、スマートフォン、コンピューター、ウェアラブルデバイス、家電機器、デジタル看板、車両、固定型ロボットや移動型ロボットなどに具現されることもできる。
【0195】
XR/PCC装置1430は、様々なセンサにより又は外部装置から獲得した3次元ポイントクラウドデータ又はイメージデータを分析して3次元ポイントに対する位置データ及び特質データを生成することにより周辺空間又は現実オブジェクトに関する情報を得て、出力するXR客体をレンダリングして出力することができる。例えば、XR/PCC装置1430は認識された物体に関する追加情報を含むXR客体を該当認識された物体に対応して出力することができる。
【0196】
<PCC+XR+モバイルフォン>
【0197】
XR/PCC装置1430はPCC技術が適用されてモバイルフォン1440などで具現される。
【0198】
モバイルフォン1440はPCC技術に基づいてポイントクラウドコンテンツを復号し、ディスプレイする。
【0199】
<PCC+自立走行+XR>
【0200】
自律走行車両1420はPCC技術及びXR技術が適用されて、移動型ロボット、車両、無人飛行体などで具現される。
【0201】
XR/PCC技術が適用された自律走行車両1420は、XR映像を提供する手段を備えた自律走行車両やXR映像内での制御/相互作用の対象となる自律走行車両などを意味する。特に、XR映像内での制御/相互作用の対象となる自律走行車両1420はXR装置1430とは区分されて互いに連動される。
【0202】
XR/PCC映像を提供する手段を備えた自律走行車両1420は、カメラを含むセンサからセンサ情報を得、得たセンサ情報に基づいて生成されたXR/PCC映像を出力する。例えば、自律走行車両1420はHUDを備えてXR/PCC映像を出力することにより、搭乗者に現実オブジェクト又は画面内のオブジェクトに対応するXR/PCC客体を提供することができる。
【0203】
この時、XR/PCC客体がHUDに出力される場合には、XR/PCC客体の少なくとも一部が搭乗者の視線が向く実際の客体にオーバーラップされるように出力される。反面、XR/PCC客体が自律走行車両内に備えられるディスプレイに出力される場合には、XR/PCC客体の少なくとも一部が画面内の客体にオーバーラップされるように出力される。例えば、自律走行車両1220は車路、他の車両、信号灯、交通表示板、二輪車、歩行者、建物などのような客体に対応するXR/PCC客体を出力することができる。
【0204】
実施例によるVR(Virtual Reality)技術、AR(Augmented Reality)技術、MR(Mixed Reality)技術及び/又はPCC(Point Cloud Compression)技術は、様々なデバイスに適用可能である。
【0205】
即ち、VR技術は現実の客体や背景などをCG映像のみで提供するディスプレイ技術である。反面、AR技術は実際物事の映像上に仮想のCG映像を共に見せる技術である。また、MR技術は現実世界に仮想客体を混ぜて見せるという点では上記AR技術と類似する。しかし、AR技術では現実の客体とCG映像からなる仮想の客体の区別が明らかであり、現実客体を補完する形態で仮想の客体を使用する反面、MR技術では仮想の客体と現実の客体が同様の性格と見なされるという点でAR技術とは区別される。より具体的には、例えば、上記MR技術が適用されたことがホログラムサービスである。
【0206】
但し、最近にはVR、AR、MR技術を明確に区別するよりは、XR(extended Reality)技術とも呼ぶ。よって、本発明の実施例はVR、AR、MR、XR技術のいずれにも適用可能である。かかる技術はPCC、V-PCC、G-PCC技術基盤の符号化/復号が適用される。
【0207】
実施例によるPCC方法/装置は自律走行サービスを提供する車両に適用できる。
【0208】
自律走行サービスを提供する車両はPCCデバイスと有無線通信可能に連結される。
【0209】
実施例によるポイントクラウドデータ(PCC)送受信装置は、車両と有無線通信可能に連結された場合、自律走行サービスと共に提供できるAR/VR/PCCサービス関連コンテンツデータを受信/処理して車両に送信することができる。またポイントクラウドデータ送受信装置車両に搭載された場合は、ポイントクラウド送受信装置はユーザインターフェース装置で入力されたユーザ入力信号によってAR/VR/PCCサービス関連コンテンツデータを受信/処理してユーザに提供することができる。実施例による車両又はユーザインターフェース装置はユーザ入力信号を受信する。実施例によるユーザ入力信号は自律走行サービスを指示する信号を含む。
【0210】
実施例によるポイントクラウドデータ送信方法/装置は、図1の送信装置10000、ポイントクラウドビデオエンコーダー10002、送信機10003、図2の獲得-符号化-送信20000-20001-20002、図4のエンコーダー、図12の送信装置、図14のデバイス、図18のエンコーダー、図25の送信方法などを称する用語として解釈される。
【0211】
実施例によるポイントクラウドデータ受信方法/装置は、図1の受信装置10004、受信機10005、ポイントクラウドビデオデコーダー10006、図2の送信-復号-レンダリング20002-20003-20004、図10図11のデコーダー、図13の受信装置、図14のデバイス、図19のデコーダー、図26の受信方法などを称する用語として解釈される。
【0212】
また、実施例によるポイントクラウドデータ送受信方法/装置は、実施例による方法/装置と略称してもよい。
【0213】
実施例により、ポイントクラウドデータを構成するジオメトリデータ、ジオメトリ情報、位置情報などは互いに同じ意味で解釈される。ポイントクラウドデータを構成する特質データ、特質情報、属性情報などは互いに同じ意味で解釈される。
【0214】
実施例による方法/装置は、類似属性を有するポイントをグループ化して属性圧縮する方案(Attribute Compression Method by grouping points with similar attributes)を含む。
【0215】
実施例は、3次元ポイントクラウド(point cloud)データ圧縮のためのジオメトリ基盤ポイントクラウド圧縮(Geometry-based Point Cloud Compression(G-PCC))の属性(attributes)の圧縮効率を高めるための方案に関する。
【0216】
実施例は、コンテンツが有しているポイント間の属性連関性を考慮し、予測に用いられる隣接ポイント集合として選択可能な方案によって、属性の圧縮効率を高めようとする。
【0217】
実施例による方法/装置は、類似属性基盤のグループ化方法、グループ別のLOD構成及び隣接ポイント集合選択方法、及び前記した方法を支援するためのシグナリング方案を含む。
【0218】
実施例は、3次元ポイントクラウド(point cloud)データ圧縮のためのジオメトリ基盤ポイントクラウド圧縮(G-PCC)の属性(attributes)の圧縮効率を高めるための方案に関する。
【0219】
ポイントクラウドは、ポイント(point)の集合であり、各ポイントは、ジオメトリ(geometry)情報及び属性(attributes)情報を有する。ジオメトリ情報は、3次元位置(XYZ)情報であり、属性情報は、色相(RGB、YUVなど)又は/及び反射(Reflectance)値である。G-PCC符号化(encoding)過程は、ジオメトリを圧縮し、 圧縮によって変更された位置情報で再構成されたジオメトリ(reconstructed geometry=復号されたジオメトリ)に基づいて属性情報を圧縮する過程からなる。G-PCC復号(decoding)過程は、符号化されたジオメトリビットストリーム(bitstream)と属性ビットストリームが送信され、ジオメトリを復号し、復号過程によって再構成されたジオメトリに基づいて属性情報を復号する過程からなる。
【0220】
属性情報圧縮過程においては、予測変換方法、リフト変換方法、又はRAHT方法が用いられる。
【0221】
予測変換方法及びリフト変換方法では、詳細レベル(level Of Detail、以下、LOD)にポイントを分けてグループ化する。
【0222】
これをLOD生成過程といい、以下、互いに異なるLODを有するグループをLOD集合という。
【0223】
LはLODを示し、0から始まる整数である。LOD0は、ポイント間の距離が最も大きいポイントからなる集合であり、lが大きくなるほどLODlに属するポイント間の距離は小さくなる(図8を参照)。LODは1つのみが存在するように設定することができる。この場合、1つのLODにモールトン順序で整列された形態でポイントが存在する。図8のように、LODに基づいて、ポイントクラウドデータをレンダリングする。
【0224】
LOD集合を生成した後、LOD集合に基づいて、LODが等しいか小さい(ノード間の距離が大きい)グループからX(>0)個の最も近い隣接ポイント(nearest neighbor)を探索して、予測器(predictor)に隣接ポイント集合として登録する。X個は、隣接ポイントとして設定可能な最大数でユーザパラメータとして入力される。
【0225】
図9のように、LOD1に属するP3の隣接ポイントをLOD0及びLOD1から探索する。3つの最も近い隣接ノードは、P2 P4 P6になる。この3つのノードがP3の予測器に隣接ポイント集合として登録される。LODは1つのみが存在する場合、同じLOD上に順序上で現在ポイントより以前にあるポイントのうち、3つの最も近い隣接ノードを選択する。
【0226】
全てのポイントは、1つの予測器(predictor)を有する。予測器に登録された隣接ポイントから属性を予測する。予測器は、隣接ポイント集合によって属性を予測する。ポイントの属性値とポイントの予測器が予測した属性値との残差は、符号化して受信機にシグナリングされる。
【0227】
実施例は、コンテンツが有しているポイント間の属性連関性を考慮した属性圧縮方法を含む。
【0228】
実施例は、隣接ポイント集合構成方法を変更する。隣接ポイント集合構成方法は、送信機及び受信機のいずれにも適用可能である。
【0229】
実施例は、ポイントの隣接ポイント集合を構成したとき、類似属性を有するポイントの集合から隣接ポイント集合が求められるように、構成を効率的に変更する方案によって、属性圧縮効率を高めるという効果がある。
【0230】
実施例間において変更及び組み合わせが可能である。本明細書において使用される用語は、当該分野において広く使用される範囲内で、用語の意図する意味に基づいて理解できる。
【0231】
実施例は、コンテンツが有しているポイント間の属性連関性を考慮して隣接集合として選択可能なポイントの集合をグループ化し、選択可能なポイントの集合を制限する方案を提案する。
【0232】
実施例による隣接ポイント集合生成は、PCC復号化器/復号器のPCC属性符号化/復号のいずれにおいても行われる。
【0233】
実施例による方法/装置は、以下の段階を含んで行われる:
【0234】
S1500 類似属性によるグループ化、S1501 グループ別のLOD生成、S1502 各グループ別のLOD基盤の隣接ポイント集合生成。以下、各図面を参照して、各動作について説明する。
【0235】
図15は実施例によるマテリアルID(material ID)によるグループ化の一例を示す。
【0236】
実施例によるポイントクラウドデータ送信方法/装置(図1の送信装置10000、ポイントクラウドビデオエンコーダー10002、送信機10003、図2の獲得-符号化-送信20000-20001-20002、図4のエンコーダー、図12の送信装置、図14のデバイス、図18のエンコーダー、図25の送信方法など)は、図15のように、ポイントクラウドデータをグループ化する。
【0237】
実施例によるポイントクラウドデータ受信方法/装置(図1の受信装置10004、受信機10005、ポイントクラウドビデオデコーダー10006、図2の送信-復号-レンダリング20002-20003-20004、図10図11のデコーダー、図13の受信装置、図14のデバイス、図19のデコーダー、図26の受信方法など)は、図15のように、ポイントクラウドデータをグループ化する。
【0238】
実施例による方法/装置は、LODを生成する前に類似属性によるポイントクラウドデータをグループ化する。
【0239】
実施例によるグループ化は、マテリアルIDに基づいて行われる(Material IDによるグループ化)。
【0240】
ポイントクラウドの属性情報(特質データ)にマテリアルID(material ID)が存在する場合、マテリアルID(material ID)別にポイントクラウドをグループ化する。
【0241】
マテリアルID(material ID)別にグループ化するか否かは、デコーダーにシグナリングされる。デコーダーにシグナリングされ、デコーダーでも同じグループ化を生成する。本実施例に示すグループ化は、シーングラフ(scene graph)上に拡張できる。
【0242】
例えば、図15を参照すれば、帽子1500、顔、腕首、足首1501、上衣1502、下衣1503、手首1504、履物1505などポイントクラウドデータは様々なマテリアルを含む。実施例による方法/装置は、マテリアルをIDに基づいて識別する。顔色に応じて顔、腕首、足首1501は同じカラーを有してもよい。帽子、上衣、下衣、履物は互いに異なるカラーを有してもよい。同じカラーを有するマテリアルは、同じマテリアルIDを有する。例えば、帽子1500のマテリアルIDは1であり、顔、腕首、足首1501のマテリアルIDは2であり、上衣1502のマテリアルIDは3である。マテリアルIDは、整数値又はその他の値によって表現される。実施例による方法/装置は、同じマテリアルIDを有するポイントクラウドデータを同じグループに分類する。グループ化されたポイントクラウドデータは、同一/類似する特質を有するため、属性圧縮時に効率的にグループ化を活用してデータを圧縮することができる。
【0243】
図16は実施例による八分木構造の類似属性別のグループ化の一例を示す。
【0244】
実施例によるポイントクラウドデータ送信方法/装置(図1の送信装置10000、ポイントクラウドビデオエンコーダー10002、送信機10003、図2の獲得-符号化-送信20000-20001-20002、図4のエンコーダー、図12の送信装置、図14のデバイス、図18のエンコーダー、図25の送信方法など)は、図16のように、ポイントクラウドデータをグループ化する。
【0245】
実施例によるポイントクラウドデータ受信方法/装置(図1の受信装置10004、受信機10005、ポイントクラウドビデオデコーダー10006、図2の送信-復号-レンダリング20002-20003-20004、図10図11のデコーダー、図13の受信装置、図14のデバイス、図19のデコーダー、図26の受信方法など)は、図16のように、ポイントクラウドデータをグループ化する。
【0246】
実施例による方法/装置が図16のような八分木を用いる場合、八分木構造において類似属性別のポイントクラウドデータをグループ化する。
【0247】
八分木構造において類似する属性別のグループ化を行う。ジオメトリ圧縮過程において八分木が構成される。グループ化方法は、以下のようである。
【0248】
S1600 八分木のルートノードから幅優先探索(breath-first traverse)順にノードの属性類似性をチェックする。
【0249】
S1601 各々の八分木ノードに属するポイントの属性の中央値(median)と最小/最大(min/max)値を求める。
【0250】
S1602 中央値と最大/最小値の差異が所定の閾値(threshold)より大きい場合、ノードの子ノードのグループ化をチェックする。
【0251】
S1603 中央値と最大/最小値の差異が所定の閾値(threshold)より小さい場合、当該ノードを1つのグループとして設定する。
【0252】
S1604 八分木のリーフノード前のレベルまでS1601ないしS1602過程が繰り返される。
【0253】
八分木ノード別にグループ化するか否かはデコーダーにシグナリングされる。デコーダーにシグナリングされ、デコーダーでも同じグループ化を生成する。本実施例に示すグループ化は、シーングラフ(scene graph)上に拡張できる。閾値(Threshold)は、エンコーダーオプションとして入力されてもよい。
【0254】
図16を参照すれば、ルートノードから始めて1つ又は1つ以上のノードをグループ化する。類似する属性を有するノードをグループ化するために、ノードに含まれたポイントの属性値間の差が一定な閾値に含まれる1つ又は1つ以上のノードを1つのグループとして生成する。属性値の差の大きいノードは、別のグループとして指定され、属性値の差の少ないノードは1つのグループとして指定される。
【0255】
実施例による方法/装置は、グループ別にLODを生成する。
【0256】
類似属性によるグループを生成し、各グループ別にLODを生成する。ポイントクラウドのポイントをx、y、z位置値に基づいてモールトンコードに変更する。変更したモールトンコード値に基づいてポイントを整列する。整列したポイントに基づいてLODが生成され、LODl集合内のポイントはモールトン順序に基づいて整列される。
【0257】
最大いくつのLOD(=l)を生成するかはエンコーダーオプションとして入力され、デコーダーにシグナリングされる。
【0258】
各グループに属するポイントの数がN個以下である場合、LOD生成過程を行わず、1つのLODとして取り扱う。Nは、エンコーダーオプションとして入力され、デコーダーにシグナリングされる。
【0259】
図17は実施例による隣接ポイント集合検索方法の一例を示す。
【0260】
実施例によるポイントクラウドデータ送信方法/装置(図1の送信装置10000、ポイントクラウドビデオエンコーダー10002、送信機10003、図2の獲得-符号化-送信20000-20001-20002、図4のエンコーダー、図12の送信装置、図14のデバイス、図18のエンコーダー、図25の送信方法など)は、図17のように、ポイントクラウドデータを圧縮するための隣接ポイントを探索する。
【0261】
実施例によるポイントクラウドデータ受信方法/装置(図1の受信装置10004、受信機10005、ポイントクラウドビデオデコーダー10006、図2の送信-復号-レンダリング20002-20003-20004、図10図11のデコーダー、図13の受信装置、図14のデバイス、図19のデコーダー、図26の受信方法など)は、図17のように、ポイントクラウドデータを復元するための隣接ポイントを探索する。
【0262】
実施例による方法/装置は、各グループ別のLODに基づいて、隣接ポイント集合を生成する。
【0263】
距離に基づいて隣接ポイント又は最近接ポイント(NN、Nearest Neighbor)を探す場合、実際に距離が近くても、図15のように、属性差が大きい場合がある。すなわち、実施例は、実際に類似する属性同士でデータをグループ化し、LODを生成し、隣接ポイント集合を生成するため、正確で性能に優れた圧縮/復元の効果がある。
【0264】
各グループ別にLODl集合を生成し、生成したLODl、LOD0~LODl-1集合に基づいて予測器の隣接ポイント集合を生成する。
【0265】
隣接ポイント集合生成は、各グループ別に行われ、各グループ内のLODl集合に属するポイントPxの隣接ポイント集合を生成するとき、LOD0~LODl-1集合に属するポイントとLODl集合に属するポイントのうち、順序上で先にあるポイント(又は、モールトンコードがPxのモールトンコードより小さいか等しいポイント)から隣接ポイント集合を検索する。
【0266】
LODl集合に属するポイントPxの隣接ポイント集合を生成するとき、LOD0~LODl-1集合に属するポイントとLODl集合に属するポイントのうち、順序上で先にあるポイントからモールトンコードが最も近いポイントを検索する。LODの数が1つである場合、モールトンコードで整列されたリストから現在ポイントの位置を基準として隣接ポイント検索範囲を設定する。
【0267】
選択されたポイントを中心として前後で隣接ポイント検索範囲(searchRange)分に該当するポイントとPxとの距離値を比較して、最も近いポイントを最大の隣接ポイント数だけ隣接ポイントとして登録する。LOD数が1つである場合、モールトンコードで整列されたリストから現在ポイントの位置を基準として前方に隣接ポイント検索範囲数に該当するポイントとPxとの距離値を比較し、最も近いポイントを最大の隣接ポイント数だけ隣接ポイントとして登録する。
【0268】
LODl集合に属するポイントPxの隣接ポイント集合を生成するとき、隣接ポイント検索範囲にあるポイントとPxとの距離を算出して、最も近い隣接ポイントを探し、Pxの隣接ポイントとして登録する。隣接ポイントは最大の隣接ポイント数だけ登録することができる。デフォルトは3で、最大3つの隣接ポイントを探すことができる。
【0269】
コンテンツがキャプチャーされた客体、キャプチャーされた方式、使用装備などに応じて、コンテンツの属性特性が異なることがある。コンテンツの属性を考慮して、隣接ポイントとして選択されたポイントの属性が互いに類似する可能性を高めるために、グループ化方法を提供する。これにより、属性ビットストリームのサイズを減らし、圧縮効率を高めることができる。
【0270】
前述した実施例の動作に関する説明は例示によって説明した。実施例は、例示の用語及び/又は手順などによって実施例の動作が制限解釈されず、実施例が意図する範囲内で変更/変形を含むように意図されている。
【0271】
図17を参照すれば、現在の符号化(又は復号)の対象である現在ポイントPがモールトン順序に従って符号化/復号される。現在ポイントPが属するLODのインデックスに基づいて、当該LODのインデックスと等しいか小さいインデックスを有するLODに属するポイントから現在ポイントPと最も類似する隣接ポイントを探す。ポイントがモールトンコード順に整列されるため、現在ポイントPのモールトンコードと等しいか小さいポイントを現在ポイントPの位置の前で探すことができる。このとき、隣接ポイント検索範囲を設定する。検索範囲(Search Range)は様々に設定される。検索範囲は、設定された値によって用いられ、デコーダーにパラメータ情報として伝達される。検索範囲内のポイントのうち、現在ポイントと最も近いポイントの3つを現在ポイントの隣接ポイント集合として設定する。隣接ポイント集合として設定されるポイントの数は様々である。
【0272】
図18は実施例によるポイントクラウドデータ送信装置を示す。
【0273】
実施例によるポイントクラウドデータ送信方法/装置(図1の送信装置10000、ポイントクラウドビデオエンコーダー10002、送信機10003、図2の獲得-符号化-送信20000-20001-20002、図4のエンコーダー、図12の送信装置、図14のデバイス、図25の送信方法など)は、図18に対応する。図18の各構成要素は、ハードウェア、プロセッサ、ソフトウェア及び/又はそれらの組み合わせに対応する。例えば、送信装置はエンコーダーとも称される。送信装置は、メモリ及び/又はプロセッサで構成される。
【0274】
図18を参照して、以下、PCCデータ符号化器のブロック図を説明する。
【0275】
エンコーダー(encoder)、符号化器は符号化器と称し、デコーダー(decoder)、復号器は復号器と称する。符号化器の入力としてPCCデータが入り、符号化され、ジオメトリ情報ビットストリーム及び属性情報ビットストリームが出力される。実施例による属性情報符号化部は、以下のようである。隣接ポイント集合構成部は、前述した実施例の動作を行う。
【0276】
属性によるグループ化構成部は、属性に応じてグループ化を行う(図15などを参照)。グループ化するか否かが入力され、グループ化を希望する場合には行い、グループ化タイプが入力され、マテリアルID(Materia ID)によるグループ化を行ってもよく、八分木構造において類似する属性別にグループ化を行ってもよい。グループ化するか否か及びグループ化タイプは、デコーダーに送信され、それに合わせてグループ化情報を復元して、グループを復元する。属性によるグループ化構成部は、グループ化された結果をデコーダーに送信する。
【0277】
LOD構成部は、各グループ別にLODを構成する(図15図16の説明を参照)。1つのLOD内に属する最小のポイント数を基準としてグループ内のポイント数が少ない場合、1つのLODのみを構成する。
【0278】
隣接ポイント集合構成部は、各グループ別に生成されたLODを基準として、属性予測のためにポイントと距離上で近い隣接ポイント集合を構成する(図17などの説明を参照)。1つのポイント当たり最大の隣接ポイント数は、ユーザ符号化オプションとして設定され、デフォルトは3つである。
【0279】
図18を参照すれば、データ入力部は、ジオメトリ及び/又は属性を含むポイントクラウドデータを獲得する。符号化に必要な設定情報をパラメータで獲得する。座標系変換部は、ポイントの座標を符号化に適する座標系に変換する。ジオメトリ情報変換量子化処理部は、ジオメトリ(ポイント)を量子化パラメータに基づいて量子化する。空間分割部は、ジオメトリを処理するためにポイントが含まれた空間を分割する。ジオメトリ情報符号化部は、ボクセル化処理部によってジオメトリをボクセル化する。八分木生成部は、ポイントを八分木構造で表現する。生成された八分木に基づいて、ポイントクラウドデータを符号化する。八分木は、最大8つの下位ノード(子ノード)を有するツリー構造である。八分木は、(八分)木だけではなく、様々な下位ノード数を有するツリー(木)を含む。ジオメトリ情報予測部は、(八分)木に基づいて、現在ジオメトリに対する予測値を生成する。現在ジオメトリとジオメトリの予測値間の残差値のみを符号化し、ビットストリームのサイズを効率的に減らすことができる。ジオメトリ情報エントロピー符号化部は、ジオメトリをエントロピー方式に基づいて符号化する。符号化されたジオメトリはビットストリームに含まれる(図20を参照)。ジオメトリ情報符号化部は、属性情報符号化のために、符号化されたジオメトリを復元する。復元されたジオメトリ情報は、属性情報符号化部に伝達される。
【0280】
属性情報符号化部は、色相変換処理部によって、特質の1つであるカラーを符号化に適する色相表現に変換する。ノードに含まれたポイントのうち、重畳ポイントが併合された場合、色相を再調整する。すなわち、ポイントに再びカラーリングを行う。属性情報符号化部は、RAHT、リフト変換(LIFT TRANSFORM)、予測(PREDICTION)に基づいて、特質を符号化する。属性情報符号化部は、ポイントの属性に応じてポイントをグループ化する。グループ化構成部は、グループ化するか否かを示す情報、グループ化タイプを示す情報、閾値を示す情報に応じて、グループ化を行う。また、適用されたグループ化に関する情報(グループ化するか否かを示す情報、グループ化タイプを示す情報、閾値を示す情報など)をパラメータで生成し、ビットストリームに含ませてデコーダーに伝達する(図20などを参照)。LOD構成部は、ポイントクラウドデータを含むLODを生成する。LOD構成部は、1つのLODに含まれた最小のポイント数の設定に応じてLODを生成する。1つのLODに含まれた最小のポイント数を示す情報をパラメータで生成し、ビットストリームに含ませてデコーダーに伝達する(図20などを参照)。隣接ポイント集合構成部は、現在ポイントと類似するポイントを探すための候補として隣接ポイント集合を生成する。属性情報予測部は、隣接ポイント集合から現在ポイントと最も類似するポイントを予測子として用いる。現在ポイントの属性値及び予測子の属性値間の残差値を符号化し、ビットストリームのサイズを効率的に減らすことができる。残差属性情報量子化処理部は、属性情報を量子化パラメータに基づいて量子化する。属性情報エントロピー符号化部は、属性情報をエントロピー方式に基づいて符号化する。符号化された属性情報は、ビットストリームに含まれて送信される(図20などを参照)。
【0281】
図18による送信装置の符号化動作は、前述した図面の説明に従う。
【0282】
図19は実施例によるポイントクラウドデータ受信装置を示す。
【0283】
実施例によるポイントクラウドデータ受信方法/装置(図1の受信装置10004、受信機10005、ポイントクラウドビデオデコーダー10006、図2の送信-復号-レンダリング20002-20003-20004、図10図11のデコーダー、図13の受信装置、図14のデバイス、図26の受信方法など)は、図19に対応する。図19の各構成要素は、ハードウェア、プロセッサ、ソフトウェア及び/又はそれらの組み合わせに対応する。例えば、受信装置はデコーダーとも称される。受信装置は、メモリ及び/又はプロセッサで構成される。図19の受信装置は、図18の送信装置の対応する過程、逆過程を行う。
【0284】
図19を参照して、PCCデータ復号器のブロック図を説明する。復号器の入力として符号化されたジオメトリ情報ビットストリーム及び属性情報ビットストリームが入り、復号され、復元されたPCCデータが出力される。実施例による復号器の属性情報復号部は、以下のようである。隣接ポイント集合構成部は、前述した実施例の動作を行う。
【0285】
属性によるグループ化構成部は、エンコーダーで送信されたグループ化可否、グループ化タイプ、グループ化された情報を復号してグループを生成する。
【0286】
LOD構成部は、各グループ別にLODを構成する。エンコーダーから送信された1つのLOD内に属する最小のポイント数を復号し、グループ内のポイント数が少ない場合、1つのLODのみを構成する。
【0287】
隣接ポイント集合構成部は、エンコーダーの隣接ポイント集合構成部と同じ機能/動作を行うモジュールであって、エンコーダーの隣接ポイント集合構成部と同様である。
【0288】
図19を参照すれば、ジオメトリ情報復号部は、ジオメトリ情報ビットストリームを受信する(図20を参照)。ジオメトリ情報エントロピー復号部は、ジオメトリ情報をエントロピー方式に基づいて復号する。八分木再構成部は、エンコーダーにおいて適用した(八分)木ーを再構成する。符号化に用いられたツリーに基づいて、ツリーを生成し、ポイントクラウドデータと同様に復号する。ジオメトリ情報予測部は、エンコーダーと同様に、現在ジオメトリ情報に対する予測子を生成する。残差値及び予測値を合算し、ポイントクラウドデータを復元する。ジオメトリ情報変換逆量子化処理部は、エンコーダーにおいて量子化したジオメトリ情報を逆に量子化して復元する。座標系逆変換部は、エンコーダーにおいて変換した座標系を逆に変換してジオメトリ情報を復元する。ジオメトリ情報復号部は、ビットストリームに含まれたジオメトリを復元する。ジオメトリ情報復号部は、属性情報復号に必要なジオメトリ情報を伝達するために、ジオメトリ情報を復元し、復元した値を属性情報復号部に伝達する。
【0289】
属性情報復号部は、属性情報ビットストリームを受信する(図20を参照)。属性残差情報エントロピー復号部は、属性情報をエントロピー方式に基づいて復号する。属性情報復号方式は、エンコーダーと同様に、RAHT、リフト変換(LIFT TRANSFORM)、予測(PREDICTION)などを含む。属性によるグループ化構成部は、ビットストリームに含まれたパラメータ、例えば、グループ化可否情報、グループ化タイプ情報、グループ化した情報などに関するパラメータに基づいて属性情報をグループ化する。LOD構成部は、ビットストリームに含まれたLOD関連パラメータ、例えば、1つのLODに含まれた最小のポイント数を示す情報に基づいて、LODを生成する。隣接ポイント集合構成部は、エンコーダーと同様に、予測のための隣接ポイント候補集合を生成する。属性情報予測部は、エンコーダーと同様に、現在ポイントを予測する。残差属性情報逆量子化処理部は、属性情報がエンコーダーにおいて量子化されたように、逆に量子化する。色相逆変換処理部は、エンコーダーにおいて色相が変換されたように、逆に色相を変換する。属性情報復号部は、属性情報ビットストリームから属性情報を復元する。ジオメトリ情報及び/又は属性情報に基づいて、実施例による方法/装置は、ポイントクラウドデータをレンダリングする。
【0290】
図19による受信装置の復号動作は、前述した図面の説明に従う。
【0291】
図20は実施例によるポイントクラウドデータ及び/又はパラメータを含むビットストリームを示す。
【0292】
実施例を追加/実行するために、関連情報をシグナリングする。実施例によるシグナリング情報は、送信端又は受信端などにおいて用いられる。符号化されたポイントクラウドの構成は、以下のようである。ジオメトリ符号化及び/又は特質符号化を行うポイントクラウドデータエンコーダーは、以下のように符号化されたポイントクラウド(又はポイントクラウドを含むビットストリーム)を生成する。また、ポイントクラウドデータに関するシグナリング情報は、ポイントクラウドデータ送信装置のメタデータ処理部によって生成されて処理され、以下のようにポイントクラウドに含まれる。
【0293】
各略語は、以下の意味である。各略語は、同等な意味の範囲内で他の用語とも称される。SPS:シーケンスパラメータセット(Sequence Parameter Set)、GPS:ジオメトリパラメータセット(Geometry Parameter Set)、APS:特質パラメータセット(Attribute Parameter Set)、TPS:タイルパラメータセット(Tile Parameter Set)、ジオメトリ(Geom):ジオメトリビットストリーム(Geometry bitstream)=ジオメトリスライスヘッダ(geometry slice header)+ジオメトリスライスデータ(geometry slice data)、特質(Attr):特質ビットストリーム(Attribite bitstream)=特質ブリックヘッダ(attribute blick header) + 特質ブリックデータ(attribute brick data)。
【0294】
実施例による方法/装置は、属性情報符号化/復号の過程にシーケンスに対する類似属性グループ化機能のための関連情報をSPS、又はAPSに追加してもよい。
【0295】
同じシーケンス内に異なる属性特性を有しているタイル又はスライスが存在する場合、シーケンスに対する類似属性グループ化機能のための関連情報は、TPS又は各スライス(Slice)別の特質(Attr)に追加される。
【0296】
ポイントクラウドを領域別に分けて処理するように、タイル又はスライスを提供する。
【0297】
領域別に分けるとき、各々の領域別に異なる隣接ポイント集合生成オプションを設定し、複雑度(complexity)は低いものの、結果の信頼度は少し落ちる方案、又は、逆に、複雑度は高いものの、信頼度が高い方案が選択できる。受信機の処理能力(capacity)に応じて異なる設定を行う。領域別に分けるとき、所定の領域の属性特性がシーケンスの有する属性特性と異なる可能性があるため、異なる設定を行う。よって、ポイントクラウドは、タイル(Tile)に分けられる場合、各タイルごとに異なる隣接ポイントの最大範囲を適用する。ポイントクラウドは、スライス(Slice)に分けられる場合、各スライスごとに異なる隣接ポイントの最大範囲を適用する。
【0298】
実施例によるポイントクラウドデータ送信方法/装置(図1の送信装置10000、ポイントクラウドビデオエンコーダー10002、送信機10003、図2の獲得-符号化-送信20000-20001-20002、図4のエンコーダー、図12の送信装置、図14のデバイス、図18のエンコーダー、図25の送信方法など)は、ポイントクラウドデータを符号化し、関連パラメータを生成して、図20のように、ビットストリームを生成して送信する。
【0299】
実施例によるポイントクラウドデータ受信方法/装置(図1の受信装置10004、受信機10005、ポイントクラウドビデオデコーダー10006、図2の送信-復号-レンダリング20002-20003-20004、図10図11のデコーダー、図13の受信装置、図14のデバイス、図19のデコーダー、図26の受信方法など)は、図20のように、ビットストリームを受信し、パラメータに基づいて、ポイントクラウドデータを復号する。
【0300】
実施例によるビットストリームは、SPS、GPS、APSを含む。ポイントクラウドデータは、1つ又は1つ以上の特質を含むため、1つ又は1つ以上のAPSを含む。TPSは、1つ又は1つ以上のタイルに対する境界ボックスに関する情報を含む。境界ボックスに関する情報は、境界ボックスの位置座標情報、幅、高さ、深さ情報などを含む。ポイントクラウドデータの符号化/復号の単位はスライスであってもよい。実施例によるスライスはデータユニットである。ビットストリームは、1つ又は1つ以上のスライス(データユニット)を含む。スライスユニットは、スライスヘッダ及びスライスデータを含む。スライスヘッダは、スライスが含むジオメトリに関するシグナリング情報を含む。例えば、パラメータセットID、タイルID、スライスID、ジオメトリ境界ボックス位置、ジオメトリポイント数などを含む。以下、各図面を参照して、パラメータを説明する。
【0301】
図21は実施例によるシーケンスパラメータセットの構文を示す。
【0302】
属性情報符号化/復号の過程において、類似属性グループ化機能のための関連情報は、シーケンスパラメータセット(Sequence Parameter Set)に追加されてもよい。隣接ポイント設定機能支援を効率的にシグナリングする。シグナリング情報の名称は、シグナリング情報の意味及び機能の範囲内で理解できる。
【0303】
特質グループフラフ(attr_group_flag[i]):当該シーケンスの属性を圧縮するとき、属性グループ化を用いるか否かを示す。
【0304】
LOD特質最小ポイント数(attr_min_points_in_LOD[i]):シーケンスの属性を圧縮するとき、LODを生成するための属性グループ化内のポイントの最小数を示す。
【0305】
特質グループタイプ(attr_group_type[i]):当該シーケンスの属性を圧縮するとき、属性グループ化方式を示す。例えば、0=Material ID基盤のグループ化方法、1=八分木構造において類似する属性別のグループ化方法などのようにシグナリングされる。各整数値に対応する情報は互いに変更が可能である。
【0306】
プロファイル(profile_idc)は、ビットストリームが順守するプロファイルを示す。
【0307】
プロファイル互換性フラグ(profile_compatibility_flags):profile_compatibility_flagsが1である場合、ビットストリームがjと同一のprofile_idcによって表示されたプロファイルを順守することを示す。
【0308】
特質セット数(sps_num_attribute_sets)は、ビットストリームにおいてコーディングされた属性の数を示す。sps_num_attribute_setsの値は、0~63の範囲内である。
【0309】
特質ディメンション(attribute_dimension[i])は、i番目の属性の構成要素の数を示す。
【0310】
特質インスタンスID(attribute_instance_id[i])は、i番目の属性に対するインスタンスIDを示す。
【0311】
実施例によるSPSは、以下のパラメータをさらに含んでもよい。
【0312】
simple_profile_compliantは、ビットストリームが単純プロファイルに従うか(1であるとき)、否か(0であるとき)を示す。
【0313】
Dense_profile_compliantは、ビットストリームがDenseプロファイルに従うか(1であるとき)、否か(0であるとき)を示す。
【0314】
predictive_profile_compliantは、ビットストリームが予測プロファイルに従うか(1であるとき)、否か(0であるとき)を示す。
【0315】
main_profile_compliantは、ビットストリームが基本プロファイルに従うか(1であるとき)、否か(0であるとき)を示す。
【0316】
reserved_profile_18bitsは、本文書の本バージョンに従うビットストリームにおいて0に等しい。reserved_profile_18bitsに対する他の値は、ISO/IECにおいて今後の使用のために予約されている。
【0317】
slice_reordering_constraintは、ビットストリームがコーディングされたポイントクラウドフレーム内でスライスの再整列又は除去に敏感であるか(1であるとき)、否か(0であるとき)を示す。slice_reordering_constraintが1であるとき、スライスが再整列又は除去されると、ビットストリームが完全に復号されない場合がある。
【0318】
unique_point_positions_constraintが1である場合、コーディングされた各ポイントクラウドフレームにおいて全てのポイントが固有な位置を有すべきであることを示す。unique_point_positions_constraintが0である場合は、コーディングされたポイントクラウドフレームにおいて2つ以上のポイントが同じ位置を有してもよいことを示す。
【0319】
各スライスのポイントが固有な位置を有しても、同じフレーム内の他のスライスのポイントが一致する場合がある。この場合、unique_point_positions_constraintは0と設定される。
【0320】
unique_point_positions_constraintが1である場合、フレームインデックス/番号の属性値が異なっても、同じフレームにおいて同じ位置のポイントは禁止される。
【0321】
level_idcは、付録Aに示されたように、ビットストリームが順守するレベルを示す。ビットストリームは、付録Aに示された値以外のlevel_idc値を含まない。level_idcの他の値は、ISO/IECにおいて今後の使用のために予約されている。
【0322】
sps_seq_parameter_set_idは、他のDUが参照するようにSPSを識別する。sps_seq_parameter_set_idは、この文書のこのバージョンに従うビットストリームにおいて0である。sps_seq_parameter_set_idの他の値は、ISO/IECにおいて今後の使用のために予約されている。
【0323】
frame_ctr_lsb_bitsは、構文要素frame_ctr_lsbの長さをビット単位で示す。
【0324】
slice_tag_bitsは、構文要素slice_tagの長さをビット単位で指定する。
【0325】
bypass_stream_enabledは、算術コーディングされた構文要素に対するバイパスビンを別のデータストリームで伝達するか否かを指定する。1である場合、2つのデータストリームは固定長さチャンクシーケンス(11.3)を用いて多重化される。0であるとき、バイパスビンは、算術コーディングされたビットストリームの一部を形成する。
【0326】
entropy_continuation_enabledは、DUのエントロピー構文解析が以前スライスにおいてDUの最終エントロピー構文解釈状態に依存できるか(1であるとき)否か(0であるとき)を示す。slice_reordering_constraintが0であるとき、entropy_continuation_enabledが0であることは、ビットストリーム適合性の要求事項である。
【0327】
sps_extension_presentは、sps_extension_data構文要素がSPS構文構造に存在するか(1であるとき)否か(0であるとき)を示す。sps_extension_presentは、この文書のこのバージョンに従うビットストリームにおいて0である。sps_extension_presentに対する1の値は、ISO/IECにおいて今後の使用のために予約されている。
【0328】
sps_extension_dataはいずれの値を有してもよい。その存在及び価値は、この文書のこのバージョンに指定されているプロファイルに対するデコーダー適合性に影響を及ぼさない。
【0329】
seq_origin_bitsは、符号ビットを除く各seq_origin_xyz構文要素の長さをビット単位で示す。
【0330】
seq_origin_xyz[ ]及びseq_origin_log2_scaleは、応用プログラム別の座標系原点においてシーケンス座標系単位でシーケンス及びコーディング座標系のXYZ原点を示す。seq_origin_bitsが0であるとき、seq_origin_xyz[ ]とseq_origin_log2_scaleは0と類推される。原点の番目のXYZ成分は、SeqOrigin[ ]と示される。
【0331】
seq_bbox_size_bitsは、各seq_bbox_size_minus1_xyz構文要素の長さをビット単位で示す。
【0332】
seq_bbox_size_minus1_xyz[ ]+1は、シーケンス座標系においてコーディングされたボリューム次元の番目のXYZ構成要素を示す。seq_bbox_size_bitsが0である場合、コーディングされたボリューム次元が指定されない。
【0333】
seq_unit_numerator_minus1、seq_unit_denominator_minus1及びseq_unit_is_metresは、シーケンス座標系の単位ベクトルが示す長さである。
【0334】
seq_unit_is_metresが1である場合、シーケンス単位ベクトルの長さを示す。
【0335】
seq_unit_is_metresが0である場合、シーケンス単位ベクトルが以下のようなアプリケーション別の座標系単位ベクトル長さAppUnitに相対的な長さを有することを示す。
【0336】
seq_coded_scale_exponent、seq_coded_scale_mantissa_bits及びseq_coded_scale_mantissaは、コーディング座標系をシーケンス座標系に変換するスケール因子を示す。スケール因子は、1より大きいか等しい正規化された二進浮動小数点値で構文要素によって示される。seq_coded_scale_mantisssa_bitsは、構文要素seq_coded_scale_mantissaの長さをビット単位で示す。スケール因子は、SeqCodedScaleのように示される。
【0337】
geom_axis_orderは、コーディングされたポイントクラウドのXYZ軸とSTV軸との対応関係を示す。
【0338】
num_attributesは、SPS属性リストに列挙された属性の数を示す。
【0339】
AttrDim、AttrBitDepth及びAttrMaxValのそれぞれは、AttrIdx変数で識別される属性の構成要素の数、ビット深さ及び最大値を示す。
【0340】
AttrDim:=attr_components_minus1[AttrIdx]+1
【0341】
AttrBitDepth:=attr_bitdepth_minus1[AttrIdx] + 1
【0342】
AttrMaxVal:=Exp2(AttrBitDepth)-1
【0343】
を示す。_components_minus1[attrIdx]+1は、識別された属性の構成要素の数を指定する。
【0344】
3つ以上の構成要素のある属性は、原始属性データのみでコーディングすることができる(attr_coding_type=3)。
【0345】
attr_instance_id値は、属性ラベルの同じ属性を区別するために使用される。例えば、ポイントクラウドには、互いに異なる観点でサンプリングされた複数の色相属性がある。この場合、アプリケーションにおいてattr_instance_idを用いてその観点を区分する。
【0346】
attr_bitdepth_minus1[ attrIdx ]+1は、識別された属性の全ての構成要素のビット深さを指定する。
【0347】
attr_label_known[ attrIdx ]、attr_label[ attrIdx ]及びattr_label_oid[ attrIdx ]は、識別された属性によって伝達されるデータタイプを識別する。attr_label_known[ attrIdx ]は、属性がattr_label[ attrIdx ]の値によってこの文書に指定された属性であるか(0であるとき)、客体識別子attr_label_oid[ attrIdx ]で識別される外部指定の属性であるかを指定する。
【0348】
attr_labelによって識別された属性タイプがある。attr_labelによって識別された属性は、有効な数だけ構成要素を有すべきであるビットストリーム適合性の要求事項がある。未指定のattr_labelの値は、ISO/IECにおいて今後の使用のために予約されている。デコーダーは、attr_labelの予約された値で属性を復号する。
【0349】
attr_label_oidで識別される属性タイプは、この文書において指定されない。
【0350】
attr_property_cntは、属性に対するSPSにあるattribute_property構文構造の数を示す。
【0351】
図22は実施例による特質パラメータセットの構文を示す。
【0352】
属性情報符号化/復号の過程において、類似属性グループ化機能のための関連情報は、特質パラメータセット(Attribute Parameter Set)に追加されてもよい。隣接ポイント設定機能支援を効率的にシグナリングする。シグナリング情報の名称は、シグナリング情報の意味及び機能の範囲内で理解できる。特質パラメータセットは、特質に関するシグナリング情報などとも称される。
【0353】
特質グループフラグ(attr_group_flag):当該シーケンスの属性を圧縮するとき、属性グループ化を用いるか否かを示す。
【0354】
LOD特質最小ポイント数(attr_min_points_in_LOD):シーケンスの属性を圧縮するとき、LODを生成するための属性グループ化内のポイントの最小数を示す。
【0355】
特質グループタイプ(attr_group_type):当該シーケンスの属性を圧縮するとき、属性グループ化方式を示す。例えば、0=Material ID基盤のグループ化方法、1=八分木構造において類似する属性別のグループ化方法などのように表現できる。各整数値に対応する情報は、変更が可能である。
【0356】
特質パラメータセットID(aps_attr_parameter_set_id)は、他の構文要素で参照するようにAPSに対する識別子を示す。aps_attr_parameter_set_idの値は、0~15の範囲内である。
【0357】
シーケンスパラメータセットID(aps_seq_parameter_set_id)は、活性SPSに対するsps_seq_parameter_set_id値を指定する。aps_seq_parameter_set_idの値は、0~15の範囲内である。
【0358】
リフト予測最近接隣接ポイント数(Lifting_num_pred_nearest_neighbours)は、予測に用いる最近接の隣接ポイントの最大数を示す。Lifting_num_pred_nearest_neighboursの値は、1~xxの範囲内である。
【0359】
リフト最大直接予測子数(Lifting_max_num_direct_predictors)は、直接に予測に用いる予測子の最大数を示す。Lifting_max_num_direct_predictorsの値は、0~lifting_num_pred_nearest_neighboursの範囲内である。復号プロセスで用いられる変数MaxNumPredictorsの値は、以下のようである:MaxNumPredictors=lift_max_num_direct_predicots+1。
【0360】
実施例による特質パラメータセットは、以下のパラメータをさらに含んでもよい。
【0361】
num_attributesは、SPS属性リストに列挙された属性の数を示す。
【0362】
AttrDim、AttrBitDepth及びAttrMaxValのそれぞれは、AttrIdx変数で識別される属性の構成要素の数、ビット深さ及び最大値を示す。
【0363】
AttrDim:=attr_components_minus1[AttrIdx]+1
【0364】
AttrBitDepth:=attr_bitdepth_minus1[AttrIdx] + 1
【0365】
AttrMaxVal:=Exp2(AttrBitDepth)-1
【0366】
を示す_components_minus1[attrIdx]+1は、識別された属性の構成要素の数を指定する。
【0367】
3つ以上の構成要素のある属性は、原始属性データのみでコーディングすることができる(attr_coding_type=3)。
【0368】
attr_instance_id値は、属性ラベルの同じ属性を区別するために使用される。例えば、ポイントクラウドには、互いに異なる観点でサンプリングされた複数の色相属性がある。この場合、アプリケーションにおいてattr_instance_idを用いてその観点を区分する。
【0369】
attr_bitdepth_minus1[ attrIdx ]+1は、識別された属性の全ての構成要素のビット深さを指定する。
【0370】
attr_label_known[ attrIdx ]、attr_label[ attrIdx ]及びattr_label_oid[ attrIdx ]は、識別された属性によって伝達されるデータタイプを識別する。attr_label_known[ attrIdx ]は、属性がattr_label[ attrIdx ]の値によってこの文書に指定された属性であるか(0であるとき)、客体識別子attr_label_oid[ attrIdx ]で識別される外部指定の属性であるかを指定する。
【0371】
attr_labelによって識別された属性タイプは、表9に指定されている。attr_labelによって識別された属性は、有効な数だけ構成要素を有すべきであるビットストリーム適合性の要求事項がある。未指定のattr_labelの値は、ISO/IECにおいて今後の使用のために予約されている。デコーダーは、attr_labelの予約された値で属性を復号する。
【0372】
attr_label_oidで識別される属性タイプは、この文書において指定されない。
【0373】
attr_property_cntは、属性に対してSPSにあるattribute_property構文構造の数を示す。
【0374】
図23は実施例によるタイルパラメータセットの構文を示す。
【0375】
属性情報符号化/復号の過程において、類似属性グループ化機能ための関連情報は、タイルパラメータセット(Tile Parameter Set)に追加されてもよい。隣接ポイント設定機能支援を効率的にシグナリングする。シグナリング情報の名称は、シグナリング情報の意味及び機能の範囲内で理解できる。実施例によるタイルパラメータセットは、タイルに関する情報などとも称される。
【0376】
特質グループフラグ(attr_group_flag):当該タイルの属性を圧縮するとき、属性グループ化を用いるか否かを示す。
【0377】
LOD特質最小ポイント数(attr_min_points_in_LOD):当該タイルの属性を圧縮するとき、LODを生成するための属性グループ化内のポイントの最小数を示す。
【0378】
特質グループタイプ(attr_group_type):当該タイルの属性を圧縮するとき、属性グループ化方式を示す。例えば、0=Material ID基盤のグループ化方法、1=八分木構造において類似する属性別のグループ化方法のようである。各整数値は、変更が可能である。
【0379】
タイル数(num_tiles)は、ビットストリームに対してシグナリングされたタイル数を示す。これが存在しない場合、num_tilesは0と類推される。
【0380】
タイル境界ボックスオフセットx(tile_bounding_box_offset_x[i])は、直交座標においてi番目のタイルのxオフセットを示す。これが存在しない場合、tile_bounding_box_offset_x[0]の値はsps_bounding_box_offset_xと類推される。
【0381】
タイル境界ボックスオフセットy(tile_bounding_box_offset_y[i])は、直交座標においてi番目のタイルのyオフセットを示す。これが存在しない場合、tile_bounding_box_offset_y[0]の値は、sps_bounding_box_offset_yと類推される。
【0382】
タイル境界ボックスオフセットz(tile_bounding_box_offset_z[i])は、直交座標においてi番目のタイルのzオフセットを示す。これが存在しない場合、tile_bounding_box_offset_z[0]の値は、sps_bounding_box_offset_zと類推される。
【0383】
実施例によるタイルパラメータセットは、以下のパラメータをさらに含んでもよい。実施例によるタイルパラメータセットは、タイルインベントリとも称させる。
【0384】
シーケンスパラメータセットID(ti_seq_parameter_set_id)は、sps_seq_parameter_set_idで活性SPSを示す。
【0385】
フレーム数lsbビット(ti_frame_ctr_lsb_bits)は、構文要素ti_frame_ctr_lsbの長さをビット単位で示す。ti_frame_ctr_lsb_bitsは活性SPSのframe_ctr_lsb_bitsと同一である。
【0386】
フレーム数lsb(ti_frame_ctr_lsb)は、次にコーディングされたポイントクラウドフレームに対するFrameCtrのti_frame_ctr_lsb_bits LSBである。
【0387】
タイル数(tile_cnt)は、タイルインベントリによって列挙されるタイル数を示す。
【0388】
タイルID(tile_id_bits)は、各tile_id構文要素の長さをビット単位で示す。tile_id_bitsが0である場合、タイルがインデックスtileIdxによって識別されることを示す。
【0389】
タイル原点ビット(tile_origin_bits_minus1)+1は、符号ビットを除く各タイル原点xyz(tile_origin_xyz)構文要素の長さをビット単位で示す。
【0390】
タイルサイズビット(tile_size_bits_minus1)+1は、各タイルサイズ(tile_size_minus1_xyz)構文要素の長さをビット単位で示す。
【0391】
タイルID(tile_id[tileIdx])は、タイルインベントリにおいてtileIdx番目のタイルの識別子を示す。tile_id_bitsが0であるとき、tile_id[ tileIdx ]の値はtileIdxと類推される。tile_idの全ての値は、タイルインベントリにおいて固有である。
【0392】
タイル原点xyz及びタイルサイズxyz(tile_origin_xyz[tileId][]及びtile_size_minus1_xyz[ tileId ][ ])は、tileIdと同じslice_tagによって識別されるスライスを含むシーケンス座標系の境界ボックスを示す。
【0393】
タイル原点xyz(tile_origin_xyz[tileId][])は、タイルインベントリ原点を基準として、タイル境界ボックスの下方隅の番目のXYZ座標を示す。
【0394】
タイルサイズxyz(tile_size_minus1_xyz[tileId][]):+1はタイル境界ボックスの番目のXYZ次元を示す。
【0395】
原点xyz(ti_origin_bits_minus1):+1は符号ビットを除く各ti_origin_xyz構文要素の長さをビット単位で示す。
【0396】
原点xyz及び原点スケール(ti_origin_xyz[]及びti_origin_log2_scale)は、seq_origin_xyz[]及びseq_origin_log2_scaleによって指定されたシーケンス座標系のXYZ原点を示す。ti_origin_xyz[]及びti_origin_log2_scaleのそれぞれの値は、seq_origin_xyz[]及びseq_origin_log2_scaleと同一である。
【0397】
図24は実施例による特質データヘッダの構文を示す。
【0398】
図20によるビットストリームに含まれた特質を伝達するデータユニット(又はスライス)のヘッダは、以下のような情報を含む。
【0399】
特質グループフラグ(attr_group_flag):当該スライスの属性を圧縮するとき、属性グループ化を用いるか否かを示す。
【0400】
LOD特質最小ポイント数(attr_min_points_in_LOD):当該スライスの属性を圧縮するとき、LODを生成するための属性グループ化内のポイントの最小数を示す。
【0401】
特質グループタイプ(attr_group_type):当該スライスの属性を圧縮するとき、属性グループ化方式を示す。例えば、0=Material ID基盤のグループ化方法、1=八分木構造において類似する属性別のグループ化方法のようにシグナリングされる。各整数値は、変更が可能である。
【0402】
特質グループ数(attr_num_groups):当該スライスの属性を圧縮するとき、Material IDによってグループ化を行った場合、生成されたグループ数を示す。
【0403】
特質ポイント数(attr_num_points):当該スライスの属性を圧縮するとき、Material IDによってグループ化を行った場合、各グループ別のポイント数を示す。
【0404】
特質グループスプリットフラグ(attr_group_split_flag):当該スライスの属性を圧縮するとき、八分木構造において類似する属性別のグループ化を行った場合、各八分木ノード別に分割するか否かに応じてグループ化するか否かを示す。
【0405】
特質パラメータセット(abh_attr_parameter_set_id)は、活性APSのaps_attr_parameter_set_id値を示す。
【0406】
特質SPS特質インデックス(abh_attr_sps_attr_idx)は、活性SPSに設定された属性を示す。abh_attr_sps_attr_idxの値は、活性SPSにおいて0~sps_num_attribute_setsの範囲内である。
【0407】
特質ジオメトリスライスID(ash_attr_geom_slice_id)は、活性ジオメトリスライスヘッダのgsh_slice_id値を示す。
【0408】
全てのADU(特質データユニット)が開始されるとき、AttrIdx変数は、adu_sps_attr_idxと設定される: AttrIdx=adu_sps_attr_idx
【0409】
ADUによってコーディングされた属性は、attr_coding_typeが3ではない場合、最大3つの構成要素を有する。
【0410】
adu_slice_idは、先行GDU slice_idの値を示す。
【0411】
図25は実施例によるポイントクラウドデータ送信方法を示す。
【0412】
S2500 実施例によるポイントクラウドデータ送信方法は、ポイントクラウドデータを符号化する段階を含む。
【0413】
S2501 実施例によるポイントクラウドデータ送信方法は、ポイントクラウドデータを含むビットストリームを送信する段階をさらに含む。
【0414】
実施例によるポイントクラウドデータ送信方法は、図1の送信装置10000、ポイントクラウドビデオエンコーダー10002、送信機10003、図2の獲得-符号化-送信20000-20001-20002、図4のエンコーダー、図12の送信装置、図14のデバイス、図18のエンコーダーなどの説明に従う。
【0415】
図26は実施例によるポイントクラウドデータ受信方法を示す。
【0416】
S2600 実施例によるポイントクラウドデータ受信方法は、ポイントクラウドデータを含むビットストリームを受信する段階を含む。
【0417】
S2601 実施例によるポイントクラウドデータ受信方法は、ポイントクラウドデータを復号する段階をさらに含む。
【0418】
実施例によるポイントクラウドデータ受信方法/装置(図1の受信装置10004、受信機10005、ポイントクラウドビデオデコーダー10006、図2の送信-復号-レンダリング20002-20003-20004、図10図11のデコーダー、図13の受信装置、図14のデバイス、図19のデコーダーなどの説明に従う。
【0419】
実施例によるポイントクラウドデータ送信方法は、ポイントクラウドデータを符号化する段階;及びポイントクラウドデータを含むビットストリームを送信する段階;を含む。
【0420】
図15を参照すれば、material IDによるグループ化に関連して、ポイントクラウドデータを符号化する段階は、ポイントクラウドデータをマテリアルIDに基づいてグループ化する段階を含み、ポイントクラウドデータは、マテリアルIDを含む特質データを含み、特質データはカラーを含み、同じマテリアルIDを有するポイントクラウドデータの特質データは、互いに類似する。特質データとして、第1のマテリアルIDを有するタイルの領域は、特質データとして同一又は類似する属性(例えば、カラー、反射度、マテリアルなど)を有する。
【0421】
図16を参照すれば、類似属性別のグループ化に関連して、ポイントクラウドデータを符号化する段階は、ポイントクラウドデータのジオメトリデータをツリーに基づいて符号化する段階、ポイントクラウドデータの特質データをツリーに基づいてグループ化する段階を含み、特質データをグループ化する段階は、ツリーに含まれたノードに含まれる1つ又は1つ以上のポイントのうち、類似する特質データを有するポイントをグループ化し、1つ又は1つ以上のポイントの特質データの中央値、最小値、及び最大値間の差異値が閾値より小さい場合、前述した1つ又は1つ以上のポイントをグループとして生成する。
【0422】
図16を参照すれば、グループ別のLOD生成に関連して、ポイントクラウドデータを符号化する段階は、グループ化された特質データに対するLOD(Level of Detail)を生成する段階をさらに含み、LODに含まれたポイントはモールトンコードに基づいて整列される。
【0423】
図16を参照すれば、グループ別のLOD基盤の隣接ポイント集合生成に関連して、ポイントクラウドデータを符号化する段階は、LODに基づいて、ポイントクラウドデータの隣接ポイント集合を生成する段階をさらに含み、隣接ポイント集合は、ポイントクラウドデータが属するLODのインデックスと等しいか小さいインデックスを有するLODに含まれたポイントから検索範囲に基づいて検索される。
【0424】
図20を参照すれば、パラメータに関連して、ビットストリームは、類似特質グループ化に関する情報を含む。
【0425】
ポイントクラウドデータ送信方法は、送信装置によって行われる。送信装置は、エンコーダーとも称される。送信装置は、メモリ及び/又はプロセッサを含む装置とも称される。送信装置は、ポイントクラウドデータを符号化するエンコーダー;及びポイントクラウドデータを含むビットストリームを送信する送信機;を含む。
【0426】
受信方法は、送信方法の対応する過程、逆過程を行う。ポイントクラウドデータ受信方法は、ポイントクラウドデータを含むビットストリームを受信する段階;及びポイントクラウドデータを復号する段階;を含む。
【0427】
ポイントクラウドデータを復号する段階は、ポイントクラウドデータをマテリアルIDに基づいてグループ化する段階を含み、ポイントクラウドデータは、マテリアルIDを含む特質データを含み、特質データはカラーを含み、同じマテリアルIDを有するポイントクラウドデータの特質データは、互いに類似する。
【0428】
ポイントクラウドデータを復号する段階は、ポイントクラウドデータのジオメトリデータをツリーに基づいて復号する段階、ポイントクラウドデータの特質データをツリーに基づいてグループ化する段階を含み、特質データをグループ化する段階は、ツリーに含まれたノードに含まれる1つ又は1つ以上のポイントのうち、類似する特質データを有するポイントをグループ化し、1つ又は1つ以上のポイントの特質データの中央値、最小値、及び最大値間の差異値が閾値より小さい場合、1つ又は1つ以上のポイントをグループとして生成する。
【0429】
ポイントクラウドデータを復号する段階は、グループ化された特質データに対するLOD(Level of Detail)を生成する段階をさらに含み、LODに含まれたポイントは、モールトンコードに基づいて整列される。
【0430】
ポイントクラウドデータを復号する段階は、LODに基づいて、ポイントクラウドデータの隣接ポイント集合を生成する段階をさらに含み、隣接ポイント集合は、ポイントクラウドデータが属するLODのインデックスと等しいか小さいインデックスを有するLODに含まれたポイントから検索範囲に基づいて検索される。
【0431】
ビットストリームは、類似特質グループ化に関する情報を含む。
【0432】
ポイントクラウドデータ受信方法は、受信装置によって行われる。受信装置は、デコーダーとも称される。受信装置は、メモリ及び/又はプロセッサを含む装置とも称される。受信装置は、ポイントクラウドデータを含むビットストリームを受信する受信部;及びポイントクラウドデータを復号するデコーダー;を含む。
【0433】
ポイントクラウドデータを復号するデコーダー、ポイントクラウドデータをマテリアルIDに基づいてグループ化する段階を含み、ポイントクラウドデータは、マテリアルIDを含む特質データを含み、特質データはカラーを含み、同じマテリアルIDを有するポイントクラウドデータの特質データは、互いに類似する。
【0434】
前述した実施例のG-PCC属性符号化/復号の過程において、コンテンツが有しているポイント間の属性連関性を考慮し、予測に用いられる隣接ポイント集合として選択可能なポイントを制限する方案を提供する。
【0435】
コンテンツ内に1つの客体があり、その1つの客体が色相の連続性/類似性を有し、高密度でキャプチャーされ、キャプチャーされた領域が少ない領域である場合、隣接ポイントと距離が少し離れていても、ポイントの属性連関性の高いコンテンツが存在する可能性もある。コンテンツの属性特性を考慮してグループ化し、隣接ポイント集合を構成するときに影響を及ぼし、これは属性圧縮の効率に影響を及ぼす。
【0436】
提案した類似する属性を有するポイントグループ化による属性圧縮方案は、コンテンツの属性の特性上、属性の連関性の低い場合、予測に役立つより邪魔になる情報を除去することで、予測の平均値を高め、ポイント属性値との残差値を大きくせず、重要ではない情報に加重値を与えることもなく、属性ビットストリームのサイズは小さくなり、PSNRの確度は高くなる。
【0437】
これにより、本実施例は、3次元ポイントクラウド(point cloud)データ圧縮のためのジオメトリ基盤ポイントクラウド圧縮(Geometry-based Point Cloud Compression(G-PCC))のエンコーダー(符号化器)/デコーダー(復号器)においてコンテンツ属性特性を反映した属性圧縮の効率を高めて提供することができる。
【0438】
実施例による方法/装置(送信方法/装置及び/又は受信方法/装置)は、コンテンツが有している属性特性を考慮して、属性圧縮に利用する隣接ポイント集合が効果的に選択できるように類似属性に基づいてグループ化し、グループ化した基準でLODを生成することで、様々なタイプのポイントクラウドデータを効率的に符号化/復号するという効果を提供することができる。
【0439】
前述した実施例によるポイントクラウドデータエンコーダー(例えば、隣接ポイント集合生成部)は、類似属性基盤のグループ化方法、各グループ別のLOD構成及び隣接ポイント集合方法及び/又はそのためのシグナリング方法により、実施例によるポイントクラウドデータ送受信方法/装置は、最適な隣接ポイント集合で属性圧縮/復元の効率を増加させる効果がある。
【0440】
類似する属性を有するポイントグループ化による属性圧縮方案は、コンテンツの属性特性上、属性の連関性の低い場合、予測に役立つより邪魔になる情報を除去することで、予測の平均値を高め、ポイント属性値との残差値を大きくせず、重要ではない情報に加重値を与えることもなく、属性ビットストリームのサイズは小さくなり、PSNRの確度は高くなる。
【0441】
属性圧縮の効率を高めるために、隣接ポイントを選択する方法、例えば、隣接ポイント集合数を3つから6つに増加させるか、6つの隣接ポイント集合候補からより良い位置にあるポイントを選択する方法などに加えて、実施例は、隣接ポイント集合を選択する前に隣接ポイントを選択する範囲を類似属性基盤のグループ化により設定し、隣接ポイントが互いに類似する属性を有する確率を高める。すなわち、圧縮効率の性能がさらに優秀である。
【0442】
また、例えば、パッチを生成する過程において、マテリアルIDでパッチを分離する方法などに加えて、実施例は、属性圧縮のために、マテリアルID及び/又は八分木ノード別のグループ化を構成し、グループ別のLOD構成及び隣接ノード検索によって、類似属性による圧縮効率を高めることができる。
【0443】
また、マルチスライスを含むポイントクラウドデータをスケーラビリティのために単純にスライスすることに加えて、実施例は、特質データをマテリアルID及び/又は八分木ノードに基づいてグループ化する効果がある。
【0444】
実施例は方法及び/又は装置の観点で説明しており、方法の説明及び装置の説明は互いに補完して適用できる。
【0445】
説明の便宜のために各図を区分して説明したが、各図に述べている実施例を併合して新しい実施例を具現するように設計することも可能である。また、通常の技術者の必要によって、以前に説明した実施例を実行するためのプログラムが記録されているコンピューターで読み取り可能な記録媒体を設計することも実施例の権利範囲に属する。実施例による装置及び方法は、上述したように、説明された実施例の構成と方法を限定して適用されることではなく、実施例は様々に変形可能に各実施例の全部又は一部が選択的に組み合わせられて構成されることもできる。実施例の好ましい実施例について示して説明したが、実施例は上述した特定の実施例に限定されず、請求の範囲で請求する実施例の要旨から離脱せず、当該発明が属する技術分野において通常の知識を有する者により様々な変形実施が可能であり、かかる変形実施は実施例の技術的思想や見込みから個々に理解されてはいけない。
【0446】
実施例による装置の様々な構成要素は、ハードウェア、ソフトウェア、ファームウェア又はそれらの組み合わせにより構成される。実施例の様々な構成要素は一つのチップ、例えば、一つのハードウェア回路で具現される。実施例において、実施例による構成要素はそれぞれ個々のチップで具現される。実施例において、実施例による装置の構成要素のいずれかは一つ又はそれ以上のプログラムを実行できる一つ又はそれ以上のプロセッサで構成され、一つ又はそれ以上のプログラムは実施例による動作/方法のうちのいずれか一つ又はそれ以上の動作/方法を行わせるか、実行させるための指示を含む。実施例による装置の方法/動作を行うための実行可能な指示は、一つ又はそれ以上のプロセッサにより実行されるために構成された一時的ではないCRM又は他のコンピュータープログラム製品に格納されるか、又は一つ又はそれ以上のプロセッサにより実行されるために構成された一時的なCRM又は他のコンピュータープログラム製品に格納されることができる。また実施例によるメモリは、揮発性メモリ(例えば、RAMなど)だけではなく、非揮発性メモリ、フラッシュメモリ、PROMなどを全部含む概念として使用される。また、インターネットによる送信などのような搬送波の形態で具現されることも含む。またプロセッサが読み取られる記録媒体は、ネットワークで連結されたコンピューターシステムに分散されて、分散方式によりプロセッサが読み取られるコードが格納されて実行されることができる。
【0447】
この明細書において、「/」と「、」は「及び/又は」に解釈される。例えば、「A/B」は「A及び/又はB」に解釈され、「A、B」は「A及び/又はB」に解釈される。さらに、「A/B/C」は「A、B及び/又はCのうちのいずれか」を意味する。また、「A、B、C」も「A、B及び/又はCのうちのいずれか」を意味する。さらに、この明細書において、「又は」は「及び/又は」に解釈される。例えば、「A又はB」は、1)「A」のみを意味するか、2)「B」のみを意味するか、又は3)「A及びB」を意味する。言い換えれば、この明細書において「又は」は「さらに又は代わりに(additionally or alternatively)」を意味する。
【0448】
第1、第2などの用語は実施例の様々な構成要素を説明するために使用される。しかし、実施例による様々な構成要素は上記用語により解釈が制限されてはいけない。かかる用語は一つの構成要素を他の構成要素と区別するために使用されることに過ぎない。例えば、第1ユーザ入力信号は第2ユーザ入力信号と称することができる。同様に、第2ユーザ入力信号は第1ユーザ入力信号と称することができる。かかる用語の使用は様々な実施例の範囲から離脱していない。第1ユーザ入力信号及び第2ユーザ入力信号はいずれもユーザ入力信号であるが、文脈上、明確に示していない限り、同一のユーザ入力信号を意味してはいない。
【0449】
実施例を説明のために使用された用語は、特定の実施例を説明するために使用されており、実施例を制限されるものではない。実施例の説明及び請求範囲で使用したように、文脈上明確に称していない限り、単数は複数を含む。「及び/又は」表現は用語間の全ての可能な結合を含む意味で使用される。「含む」は特徴、数、段階、要素及び/又はコンポーネントが存在することを説明し、さらなる特徴、数、段階、要素及び/又はコンポーネントを含まないことを意味しない。実施例を説明するために使用される、「~である場合」、「~の時」などの条件表現は選択的な場合にのみ制限して解釈されない。特定の条件を満たすとき、特定の条件に対応して関連動作を行うか、又は関連定義が解釈されるように意図されている。
【0450】
また、この明細で説明する実施例による動作は、実施例によってメモリ及び/又はプロセッサを含む送受信装置により行われる。メモリは実施例による動作を処理/制御するためのプログラムを格納し、プロセッサはこの明細で説明した様々な動作を制御する。プロセッサはコントローラなどとも称される。実施例の動作はファームウェア、ソフトウェア及び/又はこれらの組み合わせにより行われ、ファームウェア、ソフトウェア及び/又はこれらの組み合わせはプロセッサに格納されるか又はメモリに格納される。
【0451】
一方、上述した実施例による動作は、実施例による送信装置及び/又は受信装置により行われる。送受信装置はメディアデータを送受信する送受信部、実施例によるプロセスに対する指示(プログラムコード、アルゴリズム、フローチャート及び/又はデータ)を格納するメモリ、及び送受信装置の動作を制御するプロセッサを含む。
【0452】
プロセッサはコントローラなどとも称され、例えば、ハードウェア、ソフトウェア及び/又はそれらの組み合わせに対応する。上述した実施例による動作はプロセッサにより行われる。またプロセッサは上述した実施例の動作のためのエンコーダー/デコーダーなどで具現される。
【0453】
〔発明の実施の形態〕
上述したように、実施例を実施するための最善の形態について関連内容を説明する。
【0454】
〔産業上の利用可能性〕
上述したように、実施例はポイントクラウドデータ送受信装置及びシステムに全体又は部分的に適用することができる。
【0455】
当業者であれば、実施例の範囲内で実施例を様々に変更及び変形することができる。
【0456】
実施例は変更/変形を含み、変更/変形は請求項及びそれと同一のものの範囲内である。
【0457】
〔特許請求の範囲(国際出願時)〕
〔請求項1〕
ポイントクラウドデータ送信方法であって、
ポイントクラウドデータを符号化する段階;及び
前記ポイントクラウドデータを含むビットストリームを送信する段階;を含んでなる、ポイントクラウドデータ送信方法。
〔請求項2〕
前記ポイントクラウドデータを符号化する段階は、前記ポイントクラウドデータをマテリアルIDに基づいてグループ化する段階を含み、
前記ポイントクラウドデータはマテリアルIDを含む特質データを含み、
前記特質データはカラーを含み、
同じマテリアルIDを有するポイントクラウドデータの特質データは互いに類似する、請求項1に記載のポイントクラウドデータ送信方法。
〔請求項3〕
前記ポイントクラウドデータを符号化する段階は、
前記ポイントクラウドデータのジオメトリデータをツリーに基づいて符号化する段階、
前記ポイントクラウドデータの特質データを前記ツリーに基づいてグループ化する段階、を含み、
前記特質データをグループ化する段階は、
前記ツリーに含まれたノードに含まれる1つ又は1つ以上のポイントのうち、類似する特質データを有するポイントをグループ化し、
前記1つ又は1つ以上のポイントの特質データの中央値、最小値、及び最大値間の差異値が閾値より小さい場合、前記1つ又は1つ以上のポイントをグループとして生成する、請求項1に記載のポイントクラウドデータ送信方法。
〔請求項4〕
前記ポイントクラウドデータを符号化する段階は、前記グループ化された特質データに対するLOD(Level of Detail)を生成する段階を更に含み、
前記LODに含まれたポイントはモールトンコードに基づいて整列される、請求項3に記載のポイントクラウドデータ送信方法。
〔請求項5〕
前記ポイントクラウドデータを符号化する段階は、前記LODに基づいて、前記ポイントクラウドデータの隣接ポイント集合を生成する段階を更に含み、
前記隣接ポイント集合は、前記ポイントクラウドデータが属するLODのインデックスと等しいか又は小さいインデックスを有するLODに含まれるポイントから検索範囲に基づいて検索される、請求項4に記載のポイントクラウドデータ送信方法。
〔請求項6〕
前記ビットストリームは類似特質グループ化に関する情報を含む、請求項1に記載のポイントクラウドデータ送信方法。
〔請求項7〕
ポイントクラウドデータ送信装置であって、
ポイントクラウドデータを符号化するエンコーダー;及び
前記ポイントクラウドデータを含むビットストリームを送信する送信機;を備えてなる、ポイントクラウドデータ送信装置。
〔請求項8〕
ポイントクラウドデータ受信方法であって、
ポイントクラウドデータを含むビットストリームを受信する段階;及び
前記ポイントクラウドデータを復号する段階;を含んでなる、ポイントクラウドデータ受信方法。
〔請求項9〕
前記ポイントクラウドデータを復号する段階は、前記ポイントクラウドデータをマテリアルIDに基づいてグループ化する段階を含み、
前記ポイントクラウドデータは、マテリアルIDを含む特質データを含み、
前記特質データはカラーを含み、
同じマテリアルIDを有するポイントクラウドデータの特質データは互いに類似する、請求項8に記載のポイントクラウドデータ受信方法。
〔請求項10〕
前記ポイントクラウドデータを復号する段階は、
前記ポイントクラウドデータのジオメトリデータをツリーに基づいて復号する段階、
前記ポイントクラウドデータの特質データを前記ツリーに基づいてグループ化する段階、を含み、
前記特質データをグループ化する段階は、
前記ツリーに含まれたノードに含まれる1つ又は1つ以上のポイントのうち、類似する特質データを有するポイントをグループ化し、
前記1つ又は1つ以上のポイントの特質データの中央値、最小値、及び最大値間の差異値が閾値より小さい場合、前記1つ又は1つ以上のポイントをグループとして生成する、請求項8に記載のポイントクラウドデータ受信方法。
〔請求項11〕
前記ポイントクラウドデータを復号する段階は、前記グループ化された特質データに対するLOD(Level of Detail)を生成する段階を更に含み、
前記LODに含まれたポイントはモールトンコードに基づいて整列される、請求項10に記載のポイントクラウドデータ受信方法。
〔請求項12〕
前記ポイントクラウドデータを復号する段階は、前記LODに基づいて、前記ポイントクラウドデータの隣接ポイント集合を生成する段階を更に含み、
前記隣接ポイント集合は前記ポイントクラウドデータが属するLODのインデックスと等しいか又は小さいインデックスを有するLODに含まれたポイントから検索範囲に基づいて検索される、請求項11に記載のポイントクラウドデータ受信方法。
〔請求項13〕
前記ビットストリームは類似特質グループ化に関する情報を含む、請求項8に記載のポイントクラウドデータ受信方法。
〔請求項14〕
ポイントクラウドデータ受信装置であって、
ポイントクラウドデータを含むビットストリームを受信する受信部;及び
前記ポイントクラウドデータを復号するデコーダー;を備えてなる、ポイントクラウドデータ受信装置。
〔請求項15〕
前記デコーダーは、前記ポイントクラウドデータを復号し、前記ポイントクラウドデータをマテリアルIDに基づいてグループ化するものであり、
前記ポイントクラウドデータはマテリアルIDを含む特質データを含み、
前記特質データはカラーを含み、
同じマテリアルIDを有するポイントクラウドデータの特質データは互いに類似する、請求項14に記載のポイントクラウドデータ受信装置。



図1
図2
図3
図4
図5
図6
図7
図8
図9
図10
図11
図12
図13
図14
図15
図16
図17
図18
図19
図20
図21
図22
図23
図24
図25
図26
【国際調査報告】