(19)【発行国】日本国特許庁(JP)
(12)【公報種別】公表特許公報(A)
(11)【公表番号】
(43)【公表日】2024-04-05
(54)【発明の名称】ポイントクラウドデータ送信方法、ポイントクラウドデータ送信装置、ポイントクラウドデータ受信方法及びポイントクラウドデータ受信装置
(51)【国際特許分類】
G06T 9/00 20060101AFI20240329BHJP
H04N 19/597 20140101ALI20240329BHJP
H04N 19/70 20140101ALI20240329BHJP
【FI】
G06T9/00
H04N19/597
H04N19/70
【審査請求】未請求
【予備審査請求】未請求
(21)【出願番号】P 2023562933
(86)(22)【出願日】2022-02-07
(85)【翻訳文提出日】2023-10-27
(86)【国際出願番号】 KR2022001827
(87)【国際公開番号】W WO2022220382
(87)【国際公開日】2022-10-20
(31)【優先権主張番号】10-2021-0048927
(32)【優先日】2021-04-15
(33)【優先権主張国・地域又は機関】KR
(81)【指定国・地域】
(71)【出願人】
【識別番号】502032105
【氏名又は名称】エルジー エレクトロニクス インコーポレイティド
【氏名又は名称原語表記】LG ELECTRONICS INC.
【住所又は居所原語表記】128, Yeoui-daero, Yeongdeungpo-gu, 07336 Seoul,Republic of Korea
(74)【代理人】
【識別番号】100109841
【氏名又は名称】堅田 健史
(74)【代理人】
【識別番号】230112025
【氏名又は名称】小林 英了
(74)【代理人】
【識別番号】230117802
【氏名又は名称】大野 浩之
(74)【代理人】
【識別番号】100131451
【氏名又は名称】津田 理
(74)【代理人】
【識別番号】100167933
【氏名又は名称】松野 知紘
(74)【代理人】
【識別番号】100184181
【氏名又は名称】野本 裕史
(72)【発明者】
【氏名】パク,ユサン
(72)【発明者】
【氏名】ユル,ヒジャン
【テーマコード(参考)】
5C159
【Fターム(参考)】
5C159PP03
5C159RC11
5C159UA02
5C159UA05
(57)【要約】
本発明によるポイントクラウドデータ送信方法は、ポイントクラウドデータを符号化する段階;及び前記ポイントクラウドデータを含むビットストリームを送信する段階を含む。また本発明によるポイントクラウドデータ送信装置は、ポイントクラウドデータを符号化するエンコーダー;及び前記ポイントクラウドデータを含むビットストリームを送信する送信機;を含む。
【特許請求の範囲】
【請求項1】
ポイントクラウドデータ送信方法であって、
フレームに含まれたポイントクラウドデータを符号化する段階;及び
前記ポイントクラウドデータを含むビットストリームを送信する段階;を含んでなり、
前記ポイントクラウドデータを符号化する段階は、前記ポイントクラウドデータのジオメトリ情報を符号化する段階と、前記ポイントクラウドデータの特質情報を符号化する段階と、を含む、ポイントクラウドデータ送信方法。
【請求項2】
前記フレームに含まれた前記ポイントクラウドデータは以前のフレームに基づいて符号化される、請求項1に記載のポイントクラウドデータ送信方法。
【請求項3】
前記フレームは前記以前のフレームに連関する従属フレームである、請求項2に記載のポイントクラウドデータ送信方法。
【請求項4】
前記フレームに含まれた前記ポイントクラウドデータは前記以前のフレームのコンテキストに基づいて符号化される、請求項2に記載のポイントクラウドデータ送信方法。
【請求項5】
前記ポイントクラウドデータを符号化する段階は、前記フレームのコンテキストを格納する段階を含む、請求項2に記載のポイントクラウドデータ送信方法。
【請求項6】
前記フレームに連関する前記以前のフレームは参照フレームであり、
前記参照フレームは前記以前のフレームのタイプに基づいて探索される、請求項3に記載のポイントクラウドデータ送信方法。
【請求項7】
前記ビットストリームは前記参照フレームを示すインデックス情報を含み、
前記ビットストリームは前記フレームが前記参照フレームのコンテキストに基づいて符号化されるか否かを示す情報を含む、請求項6に記載のポイントクラウドデータ送信方法。
【請求項8】
前記インデックス情報は最初のフレームから前記参照フレームまでの距離に基づく、請求項7に記載のポイントクラウドデータ送信方法。
【請求項9】
前記フレームはIフレーム及びPフレームの何れかを含み、
前記Iフレームは複数のフレームの集合であるGoF(Group of Frames)の最初のフレームであり、
前記Pフレームは前記Iフレーム又は他のPフレームを参照して予測されたフレームである、請求項1に記載のポイントクラウドデータ送信方法。
【請求項10】
前記参照フレームはフレームの間の動きベクトルの差に基づいて探索される、請求項6に記載のポイントクラウドデータ送信方法。
【請求項11】
ポイントクラウドデータ送信装置であって、
フレームに含まれたポイントクラウドデータを符号化するエンコーダー;及び
前記ポイントクラウドデータを含むビットストリームを送信する送信機;を備えてなり、
前記エンコーダーは、前記ポイントクラウドデータのジオメトリ情報及び前記ポイントクラウドデータの特質情報を符号化する、ポイントクラウドデータ送信装置。
【請求項12】
前記フレームに含まれた前記ポイントクラウドデータは以前のフレームに基づいて符号化される、請求項11に記載のポイントクラウドデータ送信装置。
【請求項13】
前記フレームは前記以前のフレームに連関する従属フレームである、請求項12に記載のポイントクラウドデータ送信装置。
【請求項14】
前記フレームに含まれた前記ポイントクラウドデータは前記以前のフレームのコンテキストに基づいて符号化される、請求項12に記載のポイントクラウドデータ送信装置。
【請求項15】
前記エンコーダーは、前記フレームのコンテキストを格納する、請求項12に記載のポイントクラウドデータ送信装置。
【請求項16】
前記フレームに連関する前記以前のフレームは参照フレームであり、
前記参照フレームは前記以前のフレームのタイプに基づいて探索される、請求項13に記載のポイントクラウドデータ送信装置。
【請求項17】
前記ビットストリームは前記参照フレームを示すインデックス情報を含み、
前記ビットストリームは前記フレームが前記参照フレームのコンテキストに基づいて符号化されるか否かを示す情報を含む、請求項16に記載のポイントクラウドデータ送信装置。
【請求項18】
ポイントクラウドデータ受信方法であって、
フレームに含まれたポイントクラウドデータを含むビットストリームを受信する段階;及び
前記ポイントクラウドデータを復号する段階;を含んでなり、
前記ポイントクラウドデータを復号する段階は、
前記ポイントクラウドデータのジオメトリ情報を復号する段階と、
前記ポイントクラウドデータの特質情報を復号する段階と、を含む、ポイントクラウドデータ受信方法。
【請求項19】
前記フレームの前記ポイントクラウドデータは以前のフレームに基づいて復号される、請求項18に記載のポイントクラウドデータ受信方法。
【請求項20】
前記フレームは前記以前のフレームに連関する従属フレームである、請求項19に記載のポイントクラウドデータ受信方法。
【請求項21】
前記フレームの前記ポイントクラウドデータは前記以前のフレームのコンテキストに基づいて復号される、請求項19に記載のポイントクラウドデータ受信方法。
【請求項22】
前記ポイントクラウドデータを復号する段階は、前記フレームのコンテキストを格納する段階を含む、請求項18に記載のポイントクラウドデータ受信方法。
【請求項23】
前記フレームに連関する前記以前のフレームは参照フレームであり、
前記参照フレームは前記以前のフレームのタイプに基づいて探索される、請求項20に記載のポイントクラウドデータ受信方法。
【請求項24】
前記ビットストリームは前記参照フレームを示すインデックス情報を含み、
前記ビットストリームは前記フレームが前記参照フレームのコンテキストに基づいて符号化されるか否かを示す情報を含む、請求項23に記載のポイントクラウドデータ受信方法。
【請求項25】
ポイントクラウドデータ受信装置であって、
フレームに含まれたポイントクラウドデータを含むビットストリームを受信する受信部;及び
前記ポイントクラウドデータを復号するデコーダー;を備えてなり、
前記デコーダーは前記ポイントクラウドデータのジオメトリ情報及び特質情報を復号し、
前記フレームに含まれた前記ポイントクラウドデータは以前のフレームに基づいて復号される、ポイントクラウドデータ受信装置。
【請求項26】
前記フレームは前記以前のフレームに連関する従属フレームである、請求項25に記載のポイントクラウドデータ受信装置。
【請求項27】
前記フレームの前記ポイントクラウドデータは前記以前のフレームのコンテキストに基づいて復号される、請求項26に記載のポイントクラウドデータ受信装置。
【請求項28】
前記デコーダーは、前記フレームのコンテキストを格納する、請求項25に記載のポイントクラウドデータ受信装置。
【請求項29】
前記フレームに連関する前記以前のフレームは参照フレームであり、
前記参照フレームは前記以前のフレームのタイプに基づいて探索される、請求項26に記載のポイントクラウドデータ受信装置。
【請求項30】
前記ビットストリームは前記参照フレームを示すインデックス情報を含み、
前記ビットストリームは前記フレームが前記参照フレームのコンテキストに基づいて符号化されるか否かを示す情報を含む、請求項29に記載のポイントクラウドデータ受信装置。
【発明の詳細な説明】
【技術分野】
【0001】
実施例はポイントクラウドコンテンツ(Point Cloud Content)を処理する方法及び装置に関する。
【背景技術】
【0002】
ポイントクラウドコンテンツは3次元空間を表現する座標系に属する点(ポイント)の集合であるポイントクラウドで表現されるコンテンツである。ポイントクラウドコンテンツは3次元からなるメディアを表現でき、VR(Virtual Reality、仮想現実)、AR(Augmented Reality、拡張現実)、MR(Mixed Reality、複合現実)及び自律走行サービスなどの様々なサービスを提供するために使用される。しかし、ポイントクラウドコンテンツを表現するためには、数万から数十万個のポイントデータが必要である。従って、膨大な量のポイントデータを効率的に処理する方法が求められる。
【発明の概要】
【発明が解決しようとする課題】
【0003】
本発明はポイントクラウドデータを効率的に処理するための装置及び方法を提供する。本発明は遅延(latency)及び符号化/復号複雑度を解決するためのポイントクラウドデータ処理方法及び装置を提供する。
【0004】
但し、上述した技術的課題のみに制限されず、記載する全ての内容に基づいて当業者が導き出される他の技術的課題にも本発明の権利範囲を拡張することができる。
【課題を解決するための手段】
【0005】
上記技術的課題を達成するために、本発明によるポイントクラウドデータ送信方法は、ポイントクラウドデータを符号化する段階;及びポイントクラウドデータを含むビットストリームを送信する段階;を含む。また本発明によるポイントクラウドデータ受信方法は、ポイントクラウドデータを含むビットストリームを受信する段階;及びポイントクラウドデータを復号する段階;を含む。
【発明の効果】
【0006】
本発明による装置及び方法は、高効率でポイントクラウドデータを処理することができる。
【0007】
本発明による装置及び方法は、良質のポイントクラウドサービスを提供することができる。
【0008】
本発明による装置及び方法は、VRサービス、自律走行サービスなどの汎用的なサービスを提供するためのポイントクラウドコンテンツを提供することができる。
【図面の簡単な説明】
【0009】
添付図面は本発明(その実施態様)の理解を助けるためのものであり、本発明に関連する説明と共に本発明を示す。後述する様々な本発明に対するより適切な理解のために、添付図面において類似する参照番号に対応する部分を含む次の図面に関連して以下の本発明の説明を必ず参照すべきである。
【
図1】本発明によるポイントクラウドコンテンツ提供システムの一例を示す。
【
図2】本発明によるポイントクラウドコンテンツ提供動作を示すブロック図である。
【
図3】本発明によるポイントクラウドビデオキャプチャー過程の一例を示す。
【
図4】本発明によるポイントクラウドエンコーダー(Point Cloud Encoder)の一例を示す。
【
図6】本発明による八分木及び占有コード(occupancy code)の一例を示す。
【
図7】本発明による隣接ノードパターンの一例を示す。
【
図8】本発明によるLODごとのポイント構成の一例を示す。
【
図9】本発明によるLODごとのポイント構成の一例を示す。
【
図10】本発明によるポイントクラウドデコーダー(Point Cloud Decoder)の一例を示す。
【
図11】本発明によるポイントクラウドデコーダー(Point Cloud Decoder)の一例を示す。
【
図12】本発明によるポイントクラウドデータ送信装置の一例を示す。
【
図13】本発明によるポイントクラウドデータ受信装置の一例を示す。
【
図14】本発明によるポイントクラウドデータ送受信方法/装置に連動可能な構造の一例を示す。
【
図15】本発明によるポイントクラウドデータのGoF(Group of Frames)の例を示す。
【
図16】本発明によるポイントクラウドデータ送信装置の一例を示す。
【
図17】本発明によるポイントクラウドデータ受信装置の一例を示す。
【
図18】本発明によるポイントクラウドデータ送信装置の一例を示す。
【
図19】本発明によるポイントクラウドデータ受信装置の一例を示す。
【
図20】本発明によるポイントクラウドデータの符号化/復号過程の一例を示す。
【
図21】本発明によるポイントクラウドデータの符号化効率を示す。
【
図22】本発明によるポイントクラウドデータの符号化効率を示す。
【
図23】本発明による符号化されたポイントクラウドデータの一例を示す。
【
図24】本発明によるSequence Parameter SetのSyntaxの一例を示す。
【
図25】本発明によるTile Parameter SetのSyntaxの一例を示す。
【
図26】本発明によるGeometry Parameter SetのSyntaxの一例を示す。
【
図27】本発明によるAttribute Parameter SetのSyntaxの一例を示す。
【
図28】本発明によるジオメトリビットストリームのスライスヘッダーのSyntaxの一例を示す。
【
図29】本発明によるポイントクラウドデータ送信方法の一例を示す。
【
図30】本発明によるポイントクラウドデータ受信方法の一例を示す。
【発明を実施するための形態】
【0010】
添付図面を参照しながら望ましい本発明について具体的に説明する。添付図面を参照した以下の詳細な説明は、本発明によって具現可能な実施例のみを示すというより、望ましい本発明を説明するためのものである。以下の詳細な説明は本発明に関する徹底な理解を提供するために細部事項を含む。しかし、かかる細部事項がなくても本発明を実行できることは当業者にとって明らかである。
【0011】
本発明で使用するほとんどの用語は該当分野において広く使用される一般的なものであるが、一部は出願人によって任意に選択されたものもあり、その意味は必要によって以下に詳しく説明する。よって、本発明は用語の単純な名称や意味ではなく、用語が意図する意味に基づいて理解すべきである。
【0012】
図1は本発明によるポイントクラウドコンテンツ提供システムの一例を示す図である。
【0013】
図1に示したポイントクラウドコンテンツ提供システムは、送信装置(transmission device)10000及び受信装置(reception device)10004を含む。送信装置10000及び受信装置10004はポイントクラウドデータを送受信するために有無線通信が可能である。
【0014】
本発明による送信装置10000は、ポイントクラウドビデオ(又はポイントクラウドコンテンツ)を確保し処理して送信する。本発明において、送信装置10000は固定局(fixed station)、BTS(base transceiver system)、ネットワーク、AI(Ariticial Intelligence)機器及び/又はシステム、ロボット、AR/VR/XR機器及び/又はサーバーなどを含む。また本発明において、送信装置10000は無線接続技術(例、5G NR(New RAT)、LTE(Long Term Evolution))を用いて、基地局及び/又は他の無線機器と通信を行う機器、ロボット、車両、AR/VR/XR機器、携帯機器、家電、IoT(Internet of Thing)機器、AI機器/サーバーなどを含む。
【0015】
本発明による送信装置10000は、ポイントクラウドビデオ獲得部(Point Cloud Video Acquisition)10001、ポイントクラウドビデオエンコーダー(Point Cloud Video Encoder)10002及び/又は送信機(Transmitter(又は通信モジュール)10003を含む。
【0016】
本発明によるポイントクラウドビデオ獲得部10001は、キャプチャー、合成又は生成などの処理過程によりポイントクラウドビデオを獲得する。ポイントクラウドビデオは、3次元空間に位置するポイントの集合であるポイントクラウドで表現されるポイントクラウドコンテンツであって、ポイントクラウドビデオデータなどと呼ばれる。本発明によるポイントクラウドビデオは、一つ又はそれ以上のフレームを含む。一つのフレームは停止映像/ピクチャを示す。よって、ポイントクラウドビデオはポイントクラウド映像/フレーム/ピクチャを含み、ポイントクラウド映像、フレーム及びピクチャのうちのいずれかに呼ばれる。
【0017】
本発明によるポイントクラウドビデオエンコーダー10002は、確保したポイントクラウドビデオデータを符号化する。ポイントクラウドビデオエンコーダー10002はポイントクラウド圧縮(Point Cloud Compression)コーディングに基づいてポイントクラウドビデオデータを符号化する。本発明によるポイントクラウド圧縮コーディングは、G-PCC(Geometry-based Point Cloud Compression)コーディング及び/又はV-PCC(Video based Point Cloud Compression)コーディング又は次世代コーディングを含む。なお、本発明によるポイントクラウド圧縮コーディングは、上述した本発明に限られない。ポイントクラウドビデオエンコーダー10002は、符号化されたポイントクラウドビデオデータを含むビットストリームを出力する。ビットストリームは符号化されたポイントクラウドビデオデータだけではなく、ポイントクラウドビデオデータの符号化に関連するシグナリング情報を含む。
【0018】
本発明による送信機10003は、符号化されたポイントクラウドビデオデータを含むビットストリームを送信する。本発明によるビットストリームはファイル又はセグメント(例えば、ストリーミングセグメント)などにカプセル化されて、放送網及び/又はブロードバンド網などの様々なネットワークにより送信される。図示していないが、送信装置10000はカプセル化動作を行うカプセル化部(又はカプセル化モジュール)を含む。また本発明において、カプセル化部は送信機10003に含まれる。本発明において、ファイル又はセグメントはネットワークにより受信装置10004に送信されるか、又はデジタル格納媒体(例えば、USB、SD、CD、DVD、ブルーレイ、HDD、SSDなど)に格納される。本発明による送信機10003は受信装置10004(又は受信機(Receiver)10005)と4G、5G、6Gなどのネットワークにより有無線通信が可能である。また送信機10003はネットワークシステム(例えば、4G、5G、6Gなどの通信ネットワークシステム)によって必要なデータ処理動作を行う。また送信装置10000はオン・デマンド(On Demand)方式によってカプセル化されたデータを送信することもできる。
【0019】
本発明による受信装置10004は、受信機(Receiver)10005、ポイントクラウドビデオデコーダー(Point Cloud Decoder)10006及び/又はレンダラー(Renderer)10007を含む。本発明において、受信装置10004は無線接続技術(例、5G NR(New RAT)、LTE(Long Term Evolution))を用いて、基地局及び/又は他の無線機器と通信を行う機器、ロボット、車両、AR/VR/XR機器、携帯機器、家電、IoT(Internet of Thing)機器、AI機器/サーバーなどを含む。
【0020】
本発明による受信機10005は、ポイントクラウドビデオデータを含むビットストリーム又はビットストリームがカプセル化されたファイル/セグメントなどをネットワーク又は格納媒体から受信する。受信機10005はネットワークシステム(例えば、4G、5G、6Gなどの通信ネットワークシステム)により必要なデータ処理動作を行う。本発明による受信機10005は、受信したファイル/セグメントをデカプセル化してビットストリームを出力する。また本発明において、受信機10005はデカプセル化の動作を行うためのデカプセル化部(又はデカプセル化モジュール)を含む。またデカプセル化部は受信機10005とは別個のエレメント(又はコンポーネント)で具現される。
【0021】
ポイントクラウドビデオデコーダー10006は、ポイントクラウドビデオデータを含むビットストリームを復号する。ポイントクラウドビデオデコーダー10006はポイントクラウドビデオデータが符号化された方式により復号することができる(例えば、ポイントクラウドビデオエンコーダー10002の動作の逆の過程)。従って、ポイントクラウドビデオデコーダー10006はポイントクラウド圧縮の逆過程であるポイントクラウド復元コーディングを行って、ポイントクラウドビデオデータを復号することができる。ポイントクラウド復元コーディングはG-PCCコーディングを含む。
【0022】
レンダラー10007は復号されたポイントクラウドビデオデータをレンダリングする。レンダラー10007はポイントクラウドビデオデータだけではなく、オディオデータもレンダリングしてポイントクラウドコンテンツを出力する。本発明において、レンダラー10007はポイントクラウドコンテンツをディスプレイするためのディスプレイを含む。本発明において、ディスプレイはレンダラー10007に含まれず、別のデバイス又はコンポーネントで具現される。
【0023】
図面において、点線で示した矢印は、受信装置10004で得たフィードバック情報(feedback information)の送信経路を示す。フィードバック情報はポイントクラウドコンテンツを消費するユーザとの相互作用を反映するための情報であって、ユーザの情報を含む(例えば、ヘッドオリエンテーション情報)、ビューポート情報など)。特にポイントクラウドコンテンツがユーザとの相互作用が必要なサービス(例えば、自律走行サービスなど)のためのものである場合には、フィードバック情報はコンテンツ送信側(例えば、送信装置10000)及び/又はサービス供給者に伝達されることができる。実施例において、フィードバック情報は送信装置10000だけではなく受信装置10004でも使用されることができ、提供されないこともできる。
【0024】
本発明によるヘッドオリエンテーション情報はユーザの頭の位置、方向、角度、動きなどに関する情報である。本発明による受信装置10004はヘッドオリエンテーション情報に基づいてビューポート情報を計算する。ビューポート情報はユーザが見ているポイントクラウドビデオの領域に関する情報である。視点(viewpoint)はユーザがポイントクラウドビデオを見ている点であり、ビューポート領域の真ん中を意味する。即ち、ビューポートは視点を中心とする領域であり、領域のサイズ、形態などはFOV(Field Of View)により決定される。従って、受信装置10004はヘッドオリエンテーション情報以外に、装置が支援する垂直(vertical)或いは水平(horizontal)FOVなどに基づいてビューポート情報を抽出することができる。また受信装置10004はゲイズ分析(Gaze Analysis)などを行って、ユーザのポイントクラウド消費方式、ユーザが凝視するポイントクラウドビデオ領域、凝視時間などを確認する。実施例において、受信装置10004はゲイズ分析の結果を含むフィードバック情報を送信装置10000に送信する。本発明によるフィードバック情報はレンダリング及び/又はディスプレイ過程で得られる。本発明によるフィードバック情報は受信装置10004に含まれた一つ又はそれ以上のセンサにより確保される。また本発明において、フィードバック情報はレンダラー10007又は別の外部エレメント(又はデバイス、コンポーネントなど)により確保される。
図1に示された点線はレンダラー10007で確保したフィードバック情報の伝達過程を示す。ポイントクラウドコンテンツ提供システムはフィードバック情報に基づいてポイントクラウドデータを処理(符号化/復号)する。従って、ポイントクラウドビデオデータデコーダー10006はフィードバック情報に基づいて復号の動作を行うことができる。また受信装置10004はフィードバック情報を送信装置10000に送信することができる。送信装置10000(又はポイントクラウドビデオデータエンコーダー10002)はフィードバック情報に基づいて符号化の動作を行う。従って、ポイントクラウドコンテンツ提供システムは全てのポイントクラウドデータを処理(符号化/復号)せず、フィードバック情報に基づいて必要なデータ(例えば、ユーザのヘッド位置に対応するポイントクラウドデータ)を効率的に処理して、ユーザにポイントクラウドコンテンツを提供することができる。
【0025】
本発明において、送信装置10000はエンコーダー、送信デバイス、送信機などと呼ばれ、受信装置10004はデコーダー、受信デバイス、受信機などと呼ばれる。
【0026】
本発明による
図1のポイントクラウドコンテンツ提供システムで処理される(獲得/符号化/送信/復号/レンダリングの一連の過程で処理される)ポイントクラウドデータは、ポイントクラウドコンテンツデータ又はポイントクラウドビデオデータとも呼ばれる。本発明において、ポイントクラウドコンテンツデータはポイントクラウドデータに関連するメタデータ或いはシグナリング情報を含む概念として使用される。
【0027】
図1に示したポイントクラウドコンテンツ提供システムのエレメントは、ハードウェア、ソフトウェア、プロセッサ及び/又はこれらの組み合わせなどで具現される。
【0028】
図2は本発明によるポイントクラウドコンテンツ提供の動作を示すブロック図である。
【0029】
図2は
図1で説明したポイントクラウドコンテンツ提供システムの動作を示すブロック図である。上述したように、ポイントクラウドコンテンツ提供システムは、ポイントクラウド圧縮コーディング(例えば、G-PCC)に基づいてポイントクラウドデータを処理する。
【0030】
本発明によるポイントクラウドコンテンツ提供システム(例えば、ポイントクラウド送信装置10000又はポイントクラウドビデオ獲得部10001)では、ポイントクラウドビデオを獲得する(20000)。ポイントクラウドビデオは3次元空間を表現する座標系に属するポイントクラウドで表現される。本発明によるポイントクラウドビデオはPly(Polygon File format or the Stanford Triangle format)ファイルを含む。ポイントクラウドビデオが一つ又はそれ以上のフレームを有する場合、獲得したポイントクラウドビデオは一つ又はそれ以上のPlyファイルを含む。Plyファイルはポイントのジオメトリ(Geometry)及び/又は特質(Attribute)のようなポイントクラウドデータを含む。ジオメトリはポイントの位置を含む。それぞれのポイントの位置は3次元座標系(例えば、XYZ軸からなる座標系など)を示すパラメータ(例えば、X軸、Y軸、Z軸それぞれの値)で表現される。特質はポイントの特質(例えば、それぞれのポイントのテクスチャ情報、色相(YCbCr又はRGB)、反射率(r)、透明度など)を含む。一つのポイントは一つ又はそれ以上の特質(又は属性)を有する。例えば、一つのポイントは、色相の一つの特質を有するか、或いは色相及び反射率の二つの特質を有することができる。本発明において、ジオメトリは位置、ジオメトリ情報、ジオメトリデータなどとも呼ばれ、特質は特質、特質情報、特質データなどとも呼ばれる。またポイントクラウドコンテンツ提供システム(例えば、ポイントクラウド送信装置10000又はポイントクラウドビデオ獲得部10001)は、ポイントクラウドビデオの獲得過程に関連する情報(例えば、深さ情報、色相情報など)からポイントクラウドデータを確保することができる。
【0031】
本発明によるポイントクラウドコンテンツ提供システム(例えば、送信装置10000又はポイントクラウドビデオエンコーダー10002)は、ポイントクラウドデータを符号化する(20001)。ポイントクラウドコンテンツ提供システムは、ポイントクラウド圧縮コーディングに基づいてポイントクラウドデータを符号化する。上述したように、ポイントクラウドデータはポイントのジオメトリ及び特質を含む。よって、ポイントクラウドコンテンツ提供システムは、ジオメトリを符号化するジオメトリ符号化を行ってジオメトリビットストリームを出力する。ポイントクラウドコンテンツ提供システムは、特質を符号化する特質符号化を行って特質ビットストリームを出力する。本発明において、ポイントクラウドコンテンツ提供システムはジオメトリ符号化に基づいて特質符号化を行う。本発明によるジオメトリビットストリーム及び特質ビットストリームは多重化されて一つのビットストリームで出力される。本発明によるビットストリームはさらにジオメトリ符号化及び特質符号化に関連するシグナリング情報を含む。
【0032】
本発明によるポイントクラウドコンテンツ提供システム(例えば、送信装置10000又は送信機10003)は、符号化されたポイントクラウドデータを送信する(20002)。
図1で説明したように、符号化されたポイントクラウドデータはジオメトリビットストリーム、特質ビットストリームで表現される。また符号化されたポイントクラウドデータはポイントクラウドデータの符号化に関連するシグナリング情報(例えば、ジオメトリ符号化及び特質符号化に関連するシグナリング情報)と共に、ビットストリームの形態で送信される。またポイントクラウドコンテンツ提供システムは符号化されたポイントクラウドデータを送信するビットストリームをカプセル化してファイル又はセグメントの形態で送信する。
【0033】
本発明によるポイントクラウドコンテンツ提供システム(例えば、受信装置10004又は受信機10005)は、符号化されたポイントクラウドデータを含むビットストリームを受信する。またポイントクラウドコンテンツ提供システム(例えば、受信装置10004又は受信機10005)は、ビットストリームを逆多重化する。
【0034】
ポイントクラウドコンテンツ提供システム(例えば、受信装置10004又はポイントクラウドビデオデコーダー10005)は、ビットストリームで送信される符号化されたポイントクラウドデータ(例えば、ジオメトリビットストリーム、特質ビットストリーム)を復号する。ポイントクラウドコンテンツ提供システム(例えば、受信装置10004又はポイントクラウドビデオデコーダー10005)は、ビットストリームに含まれたポイントクラウドビデオデータの符号化に関連するシグナリング情報に基づいてポイントクラウドビデオデータを復号する。ポイントクラウドコンテンツ提供システム(例えば、受信装置10004又はポイントクラウドビデオデコーダー10005)は、ジオメトリビットストリームを復号してポイントの位置(ジオメトリ)を復元する。ポイントクラウドコンテンツ提供システムは、復元したジオメトリに基づいて特質ビットストリームを復号してポイントの特質を復元する。ポイントクラウドコンテンツ提供システム(例えば、受信装置10004又はポイントクラウドビデオデコーダー10005)は、復元されたジオメトリによる位置及び復号された特質に基づいてポイントクラウドビデオを復元する。
【0035】
本発明によるポイントクラウドコンテンツ提供システム(例えば、受信装置10004又はレンダラー10007)は、復号されたポイントクラウドデータをレンダリングする(20004)。ポイントクラウドコンテンツ提供システム(例えば、受信装置10004又はレンダラー10007)は、復号過程で復号されたジオメトリ及び特質を様々なレンダリング方式によってレンダリングする。ポイントクラウドコンテンツのポイントは、一定の厚さを有する定点、該当定点の位置を中央とする所定の最小サイズを有する立方体、又は定点の位置を中央とする円などにレンダリングされる。レンダリングされたポイントクラウドコンテンツの全部又は一部の領域はディスプレイ(例えば、VR/ARディスプレイ、一般ディスプレイなど)によりユーザに提供される。
【0036】
本発明によるポイントクラウドコンテンツ提供システム(例えば、受信装置10004)は、フィードバック情報を確保することができる(20005)。ポイントクラウドコンテンツ提供システムは、フィードバック情報に基づいてポイントクラウドデータを符号化及び/又は復号する。本発明によるフィードバック情報及びポイントクラウドコンテンツ提供システムの動作は、
図1で説明したフィードバック情報及び動作と同一であるので、具体的な説明は省略する。
【0037】
図3は本発明によるポイントクラウドビデオキャプチャー過程の一例を示す図である。
【0038】
図3は
図1及び
図2で説明したポイントクラウドコンテンツ提供システムのポイントクラウドビデオキャプチャー過程の一例を示す。
【0039】
ポイントクラウドコンテンツは、様々な3次元空間(例えば、現実環境を示す3次元空間、仮想環境を示す3次元空間など)に位置するオブジェクト(object)及び/又は環境を示すポイントクラウドビデオ(イメージ及び/又は映像)を含む。従って、本発明によるポイントクラウドコンテンツ提供システムは、ポイントクラウドコンテンツを生成するために一つ又はそれ以上のカメラ(例えば、深さ情報を確保できる赤外線カメラ、深さ情報に対応する色相情報を抽出できるRGBカメラなど)、プロジェクト(例えば、深さ情報を確保するための赤外線パターンプロジェクターなど)、LiDARなどを使用してポイントクラウドビデオをキャプチャーする。本発明によるポイントクラウドコンテンツ提供システムは、深さ情報から3次元空間上のポイントで構成されたジオメトリの形態を抽出し、色相情報からそれぞれのポイントの特質を抽出してポイントクラウドデータを確保する。本発明によるイメージ及び/又は映像は内向き(inward-facing)方式及び外向き(outward-facing)方式のうちのいずれかに基づいてキャプチャーされる。
【0040】
図3の左側には内向き方式が示されている。内向き方式は中心オブジェクトを取り囲んで位置する一つ又はそれ以上のカメラ(又はカメラセンサ)が中心オブジェクトをキャプチャーする方式である。内向き方式は核心核心客体に対する360°イメージをユーザに提供するポイントクラウドコンテンツ(例えば、ユーザに客体(例:キャラクター、選手、品物、俳優などの核心となる客体)の360°イメージを提供するVR/ARコンテンツ)を生成するために使用される。
【0041】
図3の右側には外向き方式が示されている。外向き方式は中心オブジェクトを取り囲んで位置する一つ又はそれ以上のカメラ(又はカメラセンサ)が中心オブジェクトではない中心オブジェクトの環境をキャプチャーする方式である。外向き方式はユーザの視点からの周辺環境を提供するためのポイントクラウドコンテンツ(例えば、自律走行車両のユーザに提供される外部環境を示すコンテンツ)を生成するために使用される。
【0042】
図示したように、ポイントクラウドコンテンツは一つ又はそれ以上のカメラのキャプチャー動作に基づいて生成される。この場合、それぞれのカメラの座標系が異なるので、ポイントクラウドコンテンツ提供システムはキャプチャー動作前にグローバル空間座標系(global coordinate system)を設定するために、一つ又はそれ以上のカメラの較正(calibration)を行う。またポイントクラウドコンテンツ提供システムは、上述したキャプチャー方式でキャプチャーされたイメージ及び/又は映像と任意のイメージ及び/又は映像を合成してポイントクラウドコンテンツを生成する。またポイントクラウドコンテンツ提供システムは、仮想空間を示すポイントクラウドコンテンツを生成する場合、
図3で説明したキャプチャー動作を行わない。本発明によるポイントクラウドコンテンツ提供システムは、キャプチャーしたイメージ及び/又は映像に対して後処理を行うこともできる。即ち、ポイントクラウドコンテンツ提供システムは、望まない領域(例えば、背景)を除去したり、キャプチャーしたイメージ及び/又は映像が連結された空間を認識して空間(spatial hole)がある場合、それを埋める動作を行うことができる。
【0043】
またポイントクラウドコンテンツ提供システムは、それぞれのカメラから確保したポイントクラウドビデオのポイントに対して座標系変換を行って、一つのポイントクラウドコンテンツを生成することができる。ポイントクラウドコンテンツ提供システムは、それぞれのカメラの位置座標を基準としてポイントの座標系変換を行う。これにより、ポイントクラウドコンテンツ提供システムは、一つの広い範囲を示すコンテンツを生成するか、或いはポイントの密度が高いポイントクラウドコンテンツを生成することができる。
【0044】
図4は本発明によるポイントクラウドエンコーダー(Point Cloud Encoder)の一例を示す図である。
【0045】
図4は
図1のポイントクラウドビデオエンコーダー10002の一例を示す。ポイントクラウドエンコーダーは、ネットワーク状況或いはアプリケーションなどによってポイントクラウドコンテンツの質(例えば、無損失-lossless、損失-lossy、損失に近い-near-lossless)を調節するために、ポイントクラウドデータ(例えば、ポイントの位置及び/又は特質)を再構成して符号化動作を行う。ポイントクラウドコンテンツの全体サイズが大きい場合(例えば、30fpsの場合、60Gbpsであるポイントクラウドコンテンツ)、ポイントクラウドコンテンツ提供システムは該当コンテンツをリアルタイムストリーミングすることができない。従って、ポイントクラウドコンテンツ提供システムは、ネットワーク環境などに合わせて提供するために、最大ターゲットビットレートに基づいてポイントクラウドコンテンツを再構成することができる。
【0046】
図1及び
図2に示したように、ポイントクラウドエンコーダーはジオメトリ符号化及び特質符号化を行うことができる。ジオメトリ符号化は特質符号化よりも先に行われる。
【0047】
本発明によるポイントクラウドエンコーダーは、座標系変換部(Transformation Coordinates)40000、量子化部(Quantize and Remove Points(Voxelize))40001、八分木分析部(Analyze Octree)40002、表面近似分析部(Analyze Surface Approximation)40003、演算エンコーダー(Arithmetic Encode)40004、ジオメトリ再構成部(Reconstruct Geometry)40005、色変換部(Transform Colors)40006、特質変換部(Transfer Attributes)40007、RAHT変換部40008、LOD生成部(Generated LOD)40009、リフト変換部(Lifting)40010、係数量子化部(Quantize Coefficients)40011及び/又は演算エンコーダー(Arithmetic Encode)40012を含む。
【0048】
座標系変換部40000、量子化部40001、八分木分析部40002、表面近似分析部40003、演算エンコーダー40004及びジオメトリ再構成部40005は、ジオメトリ符号化を行う。本発明によるジオメトリ符号化は、八分木ジオメトリコーディング、ダイレクトコーディング(direct coding)、trisoupジオメトリ符号化(trisoup geometry encoding)及びエントロピー符号化を含む。ダイレクトコーディング及びtrisoupジオメトリ符号化は選択的に或いは組み合わせて適用される。なお、ジオメトリ符号化は上記の例示に限られない。
【0049】
図示したように、本発明による座標系変換部40000は、位置を受信して座標系(coordinate)に変換する。例えば、位置は3次元空間(例えば、XYZ座標系で表現される3次元空間など)の位置情報に変換される。本発明による3次元空間の位置情報はジオメトリ情報とも称される。
【0050】
本発明による量子化部40001はジオメトリを量子化する。例えば、量子化部40001は全体ポイントの最小位置値(例えば、X軸、Y軸、Z軸に対して各軸上の最小値)に基づいてポイントを量子化する。量子化部40001は最小の位置値とそれぞれのポイントの位置値との差に所定の量子スケール(quatization scale)値を掛けた後、切り下げ又は切り上げをして最も近い整数値を探す量子化動作を行う。従って、一つ又はそれ以上のポイントは同一の量子化された位置(又は位置値)を有することができる。本発明による量子化部40001は量子化されたポイントを再構成するために、量子化された位置に基づいてボクセル化(voxelization)を行う。2次元イメージ/ビデオ情報を含む最小単位はピクセル(pixel)のように、本発明によるポイントクラウドコンテンツ(又は3次元ポイントクラウドビデオ)のポイントは一つ又はそれ以上のボクセル(voxel)に含まれる。ボクセルはボリューム(Volume)とピクセル(Pixel)を組み合わせた言葉であり、3次元空間を表現する軸(例えば、X軸、Y軸、Z軸)に基づいて3次元空間をユニット(unit=1.0)単位で分けたときに発生する3次元キュービック空間を意味する。量子化部40001は3次元空間のポイントのグループをボクセルでマッチングする。本発明において、一つのボクセルは一つのポイントのみを含む。本発明において、一つのボクセルは一つ又はそれ以上のポイントを含む。また一つのボクセルを一つのポイントで表現するために、一つのボクセルに含まれた一つ又はそれ以上のポイントの位置に基づいて、該当ボクセルの中央点(ceter)の位置を設定することができる。この場合、一つのボクセルに含まれた全ての位置の特質が統合されて(combined)、該当ボクセルに割り当てられる。
【0051】
本発明による八分木分析部40002は、ボクセルを八分木構造で表すための八分木ジオメトリコーディング(又は八分木コーディング)を行う。八分木構造は八分割構造に基づいてボクセルにマッチングされたポイントを表現する。
【0052】
本発明による表面近似分析部40003は、八分木を分析して近似化する。本発明による八分木分析及び近似化は、八分木及びボクセル化を効率的に提供するために、多数のポイントを含む領域をボクセル化するために分析を行う過程である。
【0053】
本発明による演算エンコーダー40004は、八分木及び/又は近似化された八分木をエントロピー符号化する。例えば、符号化方式は演算(Arithmetic)符号化方法を含む。符号化の結果としてジオメトリビットストリームが生成される。
【0054】
色変換部40006、特質変換部40007、RAHT変換部40008、LOD生成部40009、リフト変換部40010、係数量子化部40011及び/又は演算エンコーダー40012は、特質符号化を行う。上述したように、一つのポイントは一つ又はそれ以上の特質を有する。本発明による特質符号化は、一つのポイントが有する特質に対して等しく適用される。但し、一つの特質(例えば、色相)が一つ又はそれ以上の要素を含む場合は、各要素ごとに独立した特質符号化が適用される。本発明による特質符号化は、色変換コーディング、特質変換コーディング、RAHT(Region Adaptive Hierarchial Transform)コーディング、予測変換(Interpolaration-based hierarchical nearest-neighbour prediction-Prediction Transform)コーディング及びリフト変換(interpolation-based hierarchical nearest-neighbour prediction with an update/lifting step(Lifting Transform))コーディングを含む。ポイントクラウドコンテンツによって、上述したRAHTコーディング、予測変換コーディング及びリフト変換コーディングが選択的に使用されるか、又は一つ又はそれ以上のコーディングの組み合わせが使用される。また本発明による特質符号化は上述した例示に限られない。
【0055】
本発明による色変換部40006は、特質に含まれた色値(又はテクスチャ)を変換する色変換コーディングを行う。例えば、色変換部40006は色相情報のフォーマットを変換(例えば、RGBからYCbCrに変換)する。本発明による色変換部40006の動作は、特質に含まれた色値によって任意に(optional)適用される。
【0056】
本発明によるジオメトリ再構成部40005は、八分木及び/又は近似化した八分木を再構成(復元)する。ジオメトリ再構成部40005はポイントの分布を分析した結果に基づいて八分木/ボクセルを再構成する。再構成された八分木/ボクセルは再構成されたジオメトリ(又は復元されたジオメトリ)とも呼ばれる。
【0057】
本発明による特質変換部40007は、ジオメトリ符号化が行われていない位置及び/又は再構成されたジオメトリに基づいて特質を変換する特質変換を行う。上述したように、特質はジオメトリに従属するので、特質変換部40007は再構成されたジオメトリ情報に基づいて特質を変換することができる。例えば、特質変換部40007は、ボクセルに含まれたポイントの位置値に基づいてその位置のポイントが有する特質を変換する。上述したように、一つのボクセルに含まれた一つ又はそれ以上のポイントの位置に基づいて該当ボクセルの中央点の位置が設定される場合、特質変換部40007は一つ又はそれ以上のポイントの特質を変換する。trisoupジオメトリ符号化が行われた場合、特質変換部40007はtrisoupジオメトリ符号化に基づいて特質を変換する。
【0058】
特質変換部40007は、各ボクセルの中央点の位置(又は位置値)から特定の位置/半径内に隣接しているポイントの特質又は特質値(例えば、各ポイントの色相、又は反射率など)の平均値を計算して特質変換を行う。特質変換部40007は平均値の計算時、中央点から各ポイントまでの距離による加重値を適用する。従って、各ボクセルは位置及び計算された特質(又は特質値)を有する。
【0059】
特質変換部40007はK-Dツリー又はモールトンコード(moulton code)に基づいて各ボクセルの中央点の位置から特定の位置/半径内に存在する隣接ポイントを探索する。K-Dツリーは二分探索木(binary search tree)で迅速に最短隣接点探索(Nearest Neighbor Search-NNS)をできるように、ポイントを位置基盤に管理する資料構造を支援する。モールトンコードは全てのポイントの3次元位置を示す座標値(例えば、(x,y,z))をビット値で示し、ビットを混ぜて生成される。例えば、ポイントの位置を示す座標値が(5,9,1)であると、座標値のビット値は(0101、1001、0001)である。ビット値をz、y、xの順にビットインデックスに合わせて混ぜると、010001000111である。この値を10進数で示すと1095になる。即ち、座標値が(5,9,1)であるポイントのモールトンコード値は1095である。特質変換部40007はモールトンコード値を基準としてポイントを整列し、depth-first traversal過程により最短隣接点探索(NNS)を行う。特質変換動作後、特質コーディングのための他の変換過程でも最短隣接点探索(NNS)が必要であれば、K-Dツリー又はモールトンコードが活用される。
【0060】
図示したように、変換された特質はRAHT変換部40008及び/又はLOD生成部40009に入力される。
【0061】
本発明によるRAHT変換部40008は、再構成されたジオメトリ情報に基づいて特質情報を予測するRAHTコーディングを行う。例えば、RAHT変換部40008は、八分木の下位レベルにあるノードに連関する特質情報に基づいて、八分木の上位レベルにあるノードの特質情報を予測することができる。
【0062】
本発明によるLOD生成部40009は予測変換コーディングを行うために、LOD(Level of Detail)を生成する。本発明によるLODはポイントクラウドコンテンツの詳細を示す程度であり、LOD値が小さいほどポイントクラウドコンテンツの詳細が下がり、LOD値が大きいほどポイントクラウドコンテンツの詳細が高いことを示す。ポイントをLODによって分類できる。
【0063】
本発明によるリフト変換部40010は、ポイントクラウドの特質を加重値に基づいて変換するリフト変換コーディングを行う。上述したように、リフト変換コーディングは選択的に適用される。
【0064】
本発明による係数量子化部40011は、特質コーディングされた特質を係数に基づいて量子化する。
【0065】
本発明による演算エンコーダー40012は、量子化された特質を演算コーディングに基づいて符号化する。
【0066】
図4のポイントクラウドエンコーダーのエレメントは、図示していないが、ポイントクラウド提供装置に含まれた一つ又はそれ以上のメモリと通信可能に設定された一つ又はそれ以上のプロセッサ又は集積回路(integrated circuits)を含むハードウェア、ソフトウェア、ファームウェア又はこれらの組み合わせで具現される。一つ又はそれ以上のプロセッサは、上述した
図4のポイントクラウドエンコーダーのエレメントの動作及び/又は機能のうち、いずれか一つを行うことができる。また、一つ又はそれ以上のプロセッサは、
図4のポイントクラウドエンコーダーのエレメントの動作及び/又は機能を行うためのソフトウェアプログラム及び/又は指示(instruction)のセットを動作又は実行することができる。本発明による一つ又はそれ以上のメモリは高速ランダムアクセスメモリを含むか、又は非揮発性メモリ(例えば、一つ又はそれ以上のマグネチックディスク格納デバイス、フラッシュメモリデバイス、又は他の非揮発性固体のメモリデバイス(Solid-state memory devices)など)を含む。
【0067】
【0068】
図5はX軸、Y軸、Z軸の3つの軸で構成された座標系で表現される3次元空間上に位置するボクセルを示す。
図4に示すように、ポイントクラウドエンコーダー(例えば、量子化部40001など)はボクセル化を行う。ボクセルは3次元空間を表現する軸(例えば、X軸、Y軸、Z軸)に基づいて3次元空間をユニット(unit=1.0)単位で分けたときに発生する3次元キュービック空間を意味する。
図5は2つの極点(0,0,0)及び(2
d、2
d、2
d)により定義される境界ボックス(cubical axis-aligned bounding box)を再帰的に分割(reculsive subdividing)する八分木構造により生成されたボクセルの一例を示す。一つのボクセルは少なくとも一つ以上のポイントを含む。ボクセルはボクセル群(voxel group)との位置関係から空間座標を推定することができる。上述したように、ボクセルは2次元イメージ/映像のピクセルと同様に、特質(色相又は反射率など)を有する。ボクセルに対する具体的な説明は
図4で説明した通りであるので省略する。
【0069】
図6は本発明による八分木及び占有コード(occupancy code)の一例を示す図である。
【0070】
図1ないし
図4に示したように、ポイントクラウドコンテンツ提供システム(ポイントクラウドビデオエンコーダー10002)又はポイントクラウドエンコーダー(例えば、八分木分析部40002)は、ボクセルの領域及び/又は位置を効率的に管理するために、八分木構造基盤の八分木ジオメトリコーディング(又は八分木コーディング)を行う。
【0071】
図6の上側は八分木構造を示している。本発明によるポイントクラウドコンテンツの3次元空間は座標系の軸(例えば、X軸、Y軸、Z軸)で表現される。八分木構造は2つの極点(0,0,0)及び(2
d、2
d、2
d)により定義される境界ボックス(cubical axis-aligned bounding box)を再帰的に分割(reculsive subdividing)して生される。2dはポイントクラウドコンテンツ(又はポイントクラウドビデオ)の全体ポイントを取り囲む最小の境界ボックスを構成する値で設定される。dは八分木の深さを示す。d値は以下の式により決定される。以下の式において、(x
int
n、y
int
n、z
int
n)は量子化されたポイントの位置(又は位置値)を示す。
【0072】
【0073】
図6の上側中央に示したように、分割によって全体3次元空間は8つの空間に分かれる。分割されたそれぞれの空間は6つの面を有するキューブで表現される。
図6の右上側に示したように、8つの空間はそれぞれ再び座標系の軸(例えば、X軸、Y軸、Z軸)により分かれる。よって、それぞれの空間は再び8つの小さい空間に分かれる。分割された小さい空間も6つの面を有するキューブで表現される。このような分割方式は八分木のリーフノード(leaf node)がボクセルになるまで適用される。
【0074】
図6の下側は八分木の占有コードを示す。八分木の占有コードは一つの空間が分かれて発生する8つの分割空間がそれぞれ少なくとも一つのポイントを含むか否かを示すために生成される。従って、一つの占有コードは8つの子ノード(child node)で表現される。それぞれの子ノードは分割された空間の占有率(occupancy)を示し、子ノードは1ビットの値を有する。従って、占有コードは8ビットコードで表現される。即ち、子ノードに対応する空間に少なくとも一つのポイントが含まれていると、該当ノードは1値を有する。ノードに対応する空間にポイントが含まれていないと(empty)、該当ノードは0値を有する。
図6に示した占有コードは00100001であるので、8つの子ノードのうち、3番目の子ノード及び8番目の子ノードに対応する空間はそれぞれ少なくとも一つのポイントを含むことを示している。図示したように、3番目の子ノード及び8番目の子ノードはそれぞれ8つの子ノードを有し、それぞれの子ノードは8ビットの占有コードで表現される。図面では、3番目の子ノードの占有コードが10000111であり、8番目の子ノードの占有コードが01001111であることを示す。本発明によるポイントクラウドエンコーダー(例えば、演算エンコーダー40004)は占有コードをエントロピー符号化する。また圧縮効率を高めるために、ポイントクラウドエンコーダーは占有コードをイントラ/インターコーディングする。本発明による受信装置(例えば、受信装置10004又はポイントクラウドビデオデコーダー10006)は占有コードに基づいて八分木を再構成する。
【0075】
本発明によるポイントクラウドエンコーダー(例えば、
図4のポイントクラウドエンコーダー、又は八分木分析部40002)は、ポイントの位置を格納するためにボクセル化及び八分木コーディングを行う。しかし、3次元空間内のポイントがいつも均一に分布していることではないので、ポイントが多く存在しない特定の領域が存在し得る。従って、3次元空間の全体に対してボクセル化を行うことは非効率的である。例えば、特定の領域にポイントがほぼ存在しないと、該当領域までボクセル化を行う必要はない。
【0076】
従って、本発明によるポイントクラウドエンコーダーは、上述した特定の領域(又は八分木のリーフノードを除いたノード)についてはボクセル化を行わず、特定の領域に含まれたポイントの位置を直接コーディングするダイレクトコーディング(Direct coding)を行う。本発明によるダイレクトコーディングポイントの座標は、ダイレクトコーディングモード(Direct Coding Mode、DCM)と呼ばれる。また本発明によるポイントクラウドエンコーダーは、表面モデル(surface model)に基づいて特定の領域(又はノード)内のポイントの位置をボクセルに基づいて再構成するtrisoupジオメトリ符号化(Trisoup geometry encoding)を行うことができる。trisoupジオメトリ符号化はオブジェクトの表現を三角形メッシュ(triangle mesh)のシリーズで表現するジオメトリ符号化である。従って、ポイントクラウドデコーダーはメッシュ表面からポイントクラウドを生成することができる。本発明によるダイレクトコーディング及びtrisoupジオメトリ符号化は選択的に行われる。また本発明によるダイレクトコーディング及びtrisoupジオメトリ符号化は八分木ジオメトリコーディング(又は八分木コーディング)と結合して行うことができる。
【0077】
ダイレクトコーディング(Direct coding)を行うためには、ダイレクトコーディングを適用するための直接モード(direct mode)の使用オプションが活性化されている必要があり、ダイレクトコーディングを適用するノードはリーフノードではなく、特定のノード内に閾値(threshold)以下のポイントが存在する必要がある。またダイレクトコーディングの対象となる全体ポイントの個数は所定の閾値を超えてはいけない。上記条件を満たすと、本発明によるポイントクラウドエンコーダー(又は演算エンコーダー40004)はポイントの位置(又は位置値)をエントロピーコーディングすることができる。
【0078】
本発明によるポイントクラウドエンコーダー(例えば、表面近似分析部40003)は、八分木の特定のレベルを定め(レベルは八分木の深さdよりは小さい場合)、そのレベルからは表面モデルを使用してノード領域内のポイントの位置をボクセルに基づいて再構成するtrisoupジオメトリ符号化を行うことができる(trisoupモード)。本発明によるポイントクラウドエンコーダーは、trisoupジオメトリ符号化を適用するレベルを指定できる。例えば、指定されたレベルが八分木の深さと同一であると、ポイントクラウドエンコーダーはtrisoupモードで動作しない。即ち、本発明によるポイントクラウドエンコーダーは指定されたレベルが八分木の深さ値よりも小さい場合にのみtrisoupモードで動作することができる。本発明による指定されたレベルのノードの3次元立方体領域をブロック(block)と呼ぶ。一つのブロックは一つ又はそれ以上のボクセルを含む。ブロック又はボクセルはブリック(brick)に対応することもできる。それぞれのブロック内においてジオメトリは表面(surface)と表現される。本発明による表面は最大1回、ブロックの各エッジ(edge)と交差することができる。
【0079】
一つのブロックは12つのエッジを有するので、一つのブロック内に少なくとも12つの交差点が存在する。それぞれの交差点はバーテックス(vertex、頂点又は頂上)と呼ばれる。エッジに沿って存在するバーテックスは該当エッジを共有する全てのブロックのうち、そのエッジに隣接する少なくとも一つの占有ボクセル(occupied voxel)がある場合に検知される。本発明による占有ボクセルはポイントを含むボクセルを意味する。エッジに沿って検出されたバーテックスの位置は、該当エッジを共有する全てのブロックのうち、該当エッジに隣接する全てのボクセルのエッジによる平均位置である(the average position along the edge of all voxels)。
【0080】
バーテックスが検出されると、本発明によるポイントクラウドエンコーダーは、エッジの開始点(x、y、z)、エッジの方向ベクトル(Δx、Δy、Δz)、バーテックス位置値(エッジ内の相対的位置値)をエントロピーコーディングする。trisoupジオメトリ符号化が適用された場合、本発明によるポイントクラウドエンコーダー(例えば、ジオメトリ再構成部40005)は、三角形再構成(triangle reconstruction)、アップ-サンプリング(up-sampling)、ボクセル化過程を行って復元されたジオメトリ(再構成されたジオメトリ)を生成する。
【0081】
ブロックのエッジに位置するバーテックスはブロックを通過する表面を決定する。本発明による表面は非平面多角形である。三角形再構成の過程ではエッジの開始点、エッジの方向ベクトルとバーテックスの位置値に基づいて三角形で示される表面を再構成する。三角形再構成の過程は以下の通りである。1)丸1:各バーテックスの中心(centroid)値を計算し、2)丸2:各バーテックスの値から中心値を引いた値に3)丸3:自乗を行っって、その値を全て併せた値を得る。
【0082】
【0083】
加えられた値の最小値を求め、最小値がある軸に沿って投影(Projection)過程を行う。例えば、x要素(element)が最小である場合、各バーテックスをブロックの中心を基準としてx軸に投影し、(y,z)平面に投影させる。(y,z)平面に投影させて得た値が(ai,bi)であれば、atan2(bi、ai)によりθ値を求め、θ値を基準としてバーテックスを整列する。以下の表はバーテックスの個数によって三角形を生成するためのバーテックスの組み合わせを示している。バーテックスは1からnまで順に整列される。以下の表は4つのバーテックスに対して、バーテックスの組み合わせによって2つの三角形が構成されることを示している。1番目の三角形は整列されたバーテックスのうち、1、2、3番目のバーテックスで構成され、2番目の三角形は整列されたバーテックスのうち、3,4,1番目のバーテックスで構成される。
【0084】
Triangles formed from vertices ordered 1,…,n
【0085】
n triangles
【0086】
3(1,2,3)
【0087】
4(1,2,3), (3,4,1)
【0088】
5(1,2,3), (3,4,5), (5,1,3)
【0089】
6(1,2,3), (3,4,5), (5,6,1), (1,3,5)
【0090】
7(1,2,3), (3,4,5), (5,6,7), (7,1,3), (3,5,7)
【0091】
8(1,2,3), (3,4,5), (5,6,7), (7,8,1), (1,3,5), (5,7,1)
【0092】
9(1,2,3), (3,4,5), (5,6,7), (7,8,9), (9,1,3), (3,5,7), (7,9,3)
【0093】
10(1,2,3), (3,4,5), (5,6,7), (7,8,9), (9,10,1), (1,3,5), (5,7,9), (9,1,5)
【0094】
11(1,2,3), (3,4,5), (5,6,7), (7,8,9), (9,10,11), (11,1,3), (3,5,7), (7,9,11), (11,3,7)
【0095】
12(1,2,3), (3,4,5), (5,6,7), (7,8,9), (9,10,11), (11,12,1), (1,3,5), (5,7,9), (9,11,1), (1,5,9)
【0096】
アップサンプリング過程は三角形のエッジに沿って中間に点を追加してボクセル化するために行われる。アップサンプリング係数(upsampling factor)とブロックの幅を基準として追加点を生成する。追加点はリファインドバーテックス(refined vertice)と呼ばれる。本発明によるポイントクラウドエンコーダーはリファインドバーテックスをボクセル化することができる。またポイントクラウドエンコーダーはボクセル化された位置(又は位置値)に基づいて特質符号化を行うことができる。
【0097】
図7は本発明による隣接ノードパターンの一例を示す図である。
【0098】
ポイントクラウドビデオの圧縮効率を増加させるために、本発明によるポイントクラウドエンコーダーはコンテキスト適応演算(context adaptive arithmetic)コーディングに基づいてエントロピーコーディングを行う。
【0099】
図1ないし
図6で説明したように、ポイントクラウドコンテンツ提供システム又はポイントクラウドエンコーダー(例えば、ポイントクラウドビデオエンコーダー10002、
図4のポイントクラウドエンコーダー又は演算エンコーダー40004)は、占有コードをすぐエントロピーコーディングする。またポイントクラウドコンテンツ提供システム又はポイントクラウドエンコーダーは、現在ノードの占有コードと隣接ノードの占有率に基づいてエントロピー符号化(イントラ符号化)を行うか、又は以前フレームの占有コードに基づいてエントロピー符号化(インター符号化)を行う。本発明によるフレームは、同時間に生成されたポイントクラウドビデオの集合を意味する。本発明によるイントラ符号化/インター符号化の圧縮効率は、参照する隣接ノードの個数によって異なる。ビットが大きくなると複雑になるが、一側に傾くようにして圧縮効率を高めることができる。例えば、3-bit contextを有すると、2の3乗である8つの方法でコーディングする。分けてコーディングする部分は具現の複雑度に影響を及ぼす。従って、圧縮効率と複雑度の適正水準を合わせる必要がある。
【0100】
図7は隣接ノードの占有率に基づいて占有パターンを求める過程を示す。本発明によるポイントクラウドエンコーダーは、八分木の各ノードの隣接ノードの占有率(occupancy)を判断して隣接ノードパターン(neighbor pattern)値を得る。隣接ノードパターンは該当ノードの占有パターンを推論するために使用される。
図7の左側はノードに対応するキューブ(真ん中に位置するキューブ)及び該当キューブと少なくとも一面を共有する6つのキューブ(隣接ノード)を示している。図示したノードは同じ深さのノードである。図示した数字は6つのノードとそれぞれ連関する加重値(1、2、4、8、16、32、など)を示す。各加重値は隣接ノードの位置によって順に付与される。
【0101】
図7の右側は隣接ノードパターン値を示す。隣接ノードパターン値は占有された隣接ノード(ポイントを有する隣接ノード)の加重値が掛けられた値の合計である。従って、隣接ノードパターン値は0から63までの値を有する。隣接ノードパターン値が0であることは、該当ノードの隣接ノードのうち、ポイントを有するノード(占有ノード)がないことを意味する。隣接ノードパターン値が63であることは、隣接ノードが全て占有ノードであることを意味する。図示したように、加重値1、2、4、8が付与された隣接ノードは占有ノードであるので、隣接ノードパターン値は1、2、4、8を併せた値である15である。ポイントクラウドエンコーダーは隣接ノードパターン値によってコーディングを行うことができる(例えば、隣接ノードパターン値が63である場合、64つのコーディングを行う)。本発明においてポイントクラウドエンコーダーは隣接ノードパターン値を変更して(例えば、64を10又は6に変更するテーブルに基づく)、コーディングの複雑度を減らすことができる。
【0102】
図8は本発明によるLODごとのポイント構成の一例を示す図である。
【0103】
図1ないし
図7で説明したように、特質符号化が行われる前、符号化されたジオメトリは再構成(復元)される。ダイレクトコーディングが適用された場合、ジオメトリ再構成の動作はダイレクトコーディングされたポイントの配置を変更することを含む(例えば、ダイレクトコーディングされたポイントをポイントクラウドデータの前方に配置)。trisoupジオメトリ符号化が適用された場合、ジオメトリ再構成の過程は三角形再構成、アップサンプリング、ボクセル化の過程を特質はジオメトリに従属するので、特質符号化は再構成されたジオメトリに基づいて行われる。
【0104】
ポイントクラウドエンコーダー(例えば、LOD生成部40009)はポイントをLODごとに分類する(reorganization)。図面はLODに対応するポイントクラウドコンテンツを示す。図において左側はオリジナルポイントクラウドコンテンツを示す。図において左側から2番目は最低LODのポイントの分布を示し、最右側は最高LODのポイントの分布を示す。即ち、最低LODのポイントは粗い(sparse)分布であり、最高LODのポイントは細かい分布である。即ち、図面の下側に示された矢印方向に沿ってLODが増加するほどポイント間の間隔(又は距離)は短くなる。
【0105】
図9は本発明によるLODごとのポイント構成の一例を示す図である。
【0106】
図1ないし
図8で説明したように、ポイントクラウドコンテンツ提供システム又はポイントクラウドエンコーダー(例えば、ポイントクラウドビデオエンコーダー10002、
図4のポイントクラウドエンコーダー又はLOD生成部40009)はLODを生成する。LODはポイントを設定されたLOD距離値(又はユークリッド距離(Euclidean Distance)のセット)によって改良レベル(refinement levels)のセットで再整列して生成される。LOD生成過程はポイントクラウドエンコーダーだけではなく、ポイントクラウドデコーダーでも行われる。
【0107】
図9の上側は3次元空間に分布されたポイントクラウドコンテンツのポイントの一例(P0~P9)を示す。
図9のオリジナルオーダー(Original order)はLOD生成前のポイントP0~P9の順を示す。
図9のLoD基盤のオーダー(LOD based order)はLOD生成によるポイントの順を示す。ポイントはLODごとに再整列される。また高いLODは低いLODに属するポイントを含む。
図9に示すように、LOD0はP0、P5、P4及びP2を含む。LOD1はLOD0のポイントとP1、P6及びP3を含む。LOD2はLOD0のポイント、LOD1のポイント及びP9、P8及びP7を含む。
【0108】
図4で説明したように、本発明によるポイントクラウドエンコーダーは予測変換コーディング、リフト変換コーディング及びRAHT変換コーディングを選択的に又は組み合わせて行うことができる。
【0109】
本発明によるポイントクラウドエンコーダーは、ポイントに対する予測機(predictor)を生成して各ポイントの予測特質(又は予測特質値)を設定するための予測変換コーディングを行う。即ち、N個のポイントに対してN個の予測機が生成される。本発明による予測機は各ポイントのLOD値とLODごとに設定された距離内に存在する隣接ポイントに対するインデックス情報及び隣接ポイントまでの距離値に基づいて加重値(=1/距離)を計算することができる。
【0110】
本発明による予測特質(又は特質値)は、各ポイントの予測機に設定された隣接ポイントの特質(又は特質値、例えば、色相、反射率など)に各隣接ポイントまでの距離に基づいて計算された加重(又は加重値)を掛けた値の平均値で設定される。本発明によるポイントクラウドエンコーダー(例えば、係数量子化部40011)は、各ポイントの特質(特質値)から予測特質(特質値)を引いた残余値(residuals、残余特質、残余特質値、特質予測残余値などとも呼ばれる)を量子化(quatization)及び逆量子化(inverse quantization)することができる。量子化過程は以下の表の通りである。
【0111】
【0112】
【0113】
本発明によるポイントクラウドエンコーダー(例えば、演算エンコーダー40012)は、各ポイントの予測機に隣接するポイントがあれば、上述したように、量子化及び逆量子化された残余値をエントロピーコーディングする。本発明によるポイントクラウドエンコーダー(例えば、演算エンコーダー40012)は、各ポイントの予測機に隣接するポイントがないと、上述した過程を行わず、該当ポイントの特質をエントロピーコーディングする。
【0114】
本発明によるポイントクラウドエンコーダー(例えば、リフト変換部40010)は、各ポイントの予測機を生成し、予測機に計算されたLODを設定及び隣接ポイントを登録し、隣接ポイントまでの距離による加重値を設定してリフト変換コーディングを行う。本発明によるリフト変換コーディングは、上述した測変換コーディングと類似するが、特質値に加重値を累積適用するという点で差がある。本発明による特質値に加重値を累積適用する過程は以下の通りである。
【0115】
1)各ポイントの加重値を貯蔵する配列QW(QuantizationWieght)を生成する。QWの全ての要素の初期値は1.0である。予測機に登録された隣接ノードの予測機インデックスのQW値に現在ポイントの予測機の加重値を掛けた値を加える。
【0116】
2)リフト予測過程:予測された特質値を計算するために、ポイントの特質値に加重値を掛けた値を既存の特質値から引く。
【0117】
3)アップデートウェイト(updateweight)及びアップデートという臨時配列を生成し、臨時配列を0に初期化する。
【0118】
4)全ての予測機に対して計算された加重値に予測機インデックスに該当するQWに貯蔵された加重値をさらに掛けて算出された加重値をアップデートウェイト配列に隣接ノードのインデックスとして累積して合算する。アップデート配列には隣接ノードのインデックスの特質値に算出された加重値を掛けた値を累積して合算する。
【0119】
5)リフトアップデート過程:全ての予測機に対して、アップデート配列の特質値を予測機インデックスのアップデートウェイト配列の加重値で割り、割った値に再び既存の特質値を加える。
【0120】
6)全ての予測機に対して、リフトアップデート過程でアップデートされた特質値にリフト予測過程でアップデートされた(QWに貯蔵された)加重値をさらに掛けて予測特質値を算出する。本発明によるポイントクラウドエンコーダー(例えば、係数量子化部40011)は予測特質値を量子化する。またポイントクラウドエンコーダー(例えば、演算エンコーダー40012)は量子化された特質値をエントロピーコーディングする。
【0121】
本発明によるポイントクラウドエンコーダー(例えば、RAHT変換部40008)は、八分木の下位レベルのノードに連関する特質を使用して上位レベルのノードの特質を予測するRAHT変換コーディングを行う。RAHT変換コーディングは八分木バックワードスキャンによる特質イントラコーディングの一例である。本発明によるポイントクラウドエンコーダーは、ボクセルから全体領域にスキャンし、各ステップもぽてボクセルをもっと大きいブロックに合わせながらルートノード(root node)までの併合過程を繰り返して行う。本発明による併合過程は、占有ノードのみについて行われる。空ノード(empty node)については併合過程が行われず、空ノードの直上位ノードについて併合過程が行われる。
【0122】
以下の式はRAHT変換行列を示す。
【0123】
【0124】
【0125】
gDC値もハイパス係数のように量子化されてエントロピーコーディングされる。
【0126】
図10は本発明によるポイントクラウドデコーダー(Point Cloud Decoder)の一例を示す図である。
【0127】
図10に示したポイントクラウドデコーダーは、
図1に示したポイントクラウドビデオデコーダー10006の一例であり、
図1で説明したイントクラウドビデオデコーダー10006の動作などと同一又は類似する動作を行う。図示したように、ポイントクラウドデコーダーは一つ又はそれ以上のビットストリーム(bitstream)に含まれたジオメトリビットストリーム(geometry bitstream)及び特質ビットストリーム(Attribute bitstream)を受信する。ポイントクラウドデコーダーはジオメトリデコーダー(geometry decoder)及び特質デコーダー(Attribute decoder)を含む。ジオメトリデコーダーはジオメトリビットストリームに対してジオメトリ復号を行って復号されたジオメトリ(decoded geometry)を出力する。特質デコーダーは復号されたジオメトリ及び特質ビットストリームに基づいて特質復号を行って復号された特質(decoded Attributes)を出力する。復号されたジオメトリ及び復号された特質はポイントクラウドコンテンツを復元(decoded point cloud)するために使用される。
【0128】
図11は本発明によるポイントクラウドデコーダー(Point Cloud Decoder)の一例を示す図である。
【0129】
図11に示したポイントクラウドデコーダーは
図10で説明したポイントクラウドデコーダーの一例であり、
図1ないし
図9で説明したポイントクラウドエンコーダーの符号化動作の逆過程である復号動作を行う。
【0130】
図1及び
図10で説明したように、ポイントクラウドデコーダーはジオメトリ復号及び特質復号を行う。ジオメトリ復号は特質復号よりも先に行われる。
【0131】
本発明によるポイントクラウドデコーダーは、演算デコーダー(arithmetic decode)11000、八分木合成部(synthesize octree)11001、表面近似合成部(synthesize surface approximation)11002、ジオメトリ再構成部(reconstruct geometry)11003、座標系逆変換部(inverse transform coordinates)11004、演算デコーダー(arithmetic decode)11005、逆量子化部(inverse quantize)11006、RAHT変換部11007、LOD生成部(generate LOD)11008、逆リフト部(Inverse lifting)11009及び/又は色逆変換部(inverse transform colors)11010を含む。
【0132】
演算デコーダー11000、八分木合成部11001、表面近似合成部11002、ジオメトリ再構成部11003及び座標系逆変換部11004はジオメトリ復号を行う。本発明によるジオメトリ復号はダイレクトコーディング(direct coding)及びtrisoupジオメトリ復号(trisoup geometry decoding)を含む。ダイレクトコーディング及びtrisoupジオメトリ復号は選択的に適用される。またジオメトリ復号は上記の例示に限られず、
図1ないし
図9で説明したジオメトリ符号化の逆過程で行われる。
【0133】
本発明による演算デコーダー11000は、受信したジオメトリビットストリームを演算コーディングに基づいて復号する。演算デコーダー11000の動作は演算エンコーダー40004の逆過程に対応する。
【0134】
本発明による八分木合成部11001は、復号されたジオメトリビットストリームから(又は復号結果、確保されたジオメトリに関する情報)から占有コードを獲得して八分木を生成する。占有コードに関する具体的な説明は
図1ないし
図9に説明した通りである。
【0135】
本発明による表面近似合成部11002は、trisoupジオメトリ符号化が適用された場合、復号されたジオメトリ及び/又は生成された八分木に基づいて表面を合成する。
【0136】
本発明によるジオメトリ再構成部11003は、表面及び/又は復号されたジオメトリに基づいてジオメトリを再生成する。
図1ないし
図9で説明したように、ダイレクトコーディング及びtrisoupジオメトリ符号化は選択的に適用される。従って、ジオメトリ再構成部11003はダイレクトコーディングが適用されたポイントの位置情報を直接持ってきて追加する。また、trisoupジオメトリ符号化が適用される場合、ジオメトリ再構成部11003はジオメトリ再構成部40005の再構成動作、例えば、三角形再構成、アップサンプリング、ボクセル化動作を行ってジオメトリを復元する。具体的な内容は
図6で説明した通りであるので省略する。復元されたジオメトリは特質を含まないポイントクラウドピクチャ又はフレームを含む。
【0137】
本発明による座標系逆変換部11004は復元されたジオメトリに基づいて座標系を変換してポイントの位置を得る。
【0138】
演算デコーダー11005、逆量子化部11006、RAHT変換部11007、LOD生成部11008、逆リフト部11009及び/又は色逆変換部11010は、
図10で説明した特質復号を行う。本発明による特質復号は、RAHT(Region Adaptive Hierarchial Transform)復号、予測変換(Interpolaration-based hierarchical nearest-neighbour prediction-Prediction Transform)復号、及びリフト変換(interpolation-based hierarchical nearest-neighbour prediction with an update/lifting step(Lifting Transform))復号を含む。上記3つの復号は選択的に使用されるか、又は一つ又はそれ以上の復号の組み合わせが使用される。また本発明による特質復号は上述した例示に限られない。
【0139】
本発明による演算デコーダー11005は、特質ビットストリームを演算コーディングに復号する。
【0140】
本発明による逆量子化部11006は、復号された特質ビットストリーム又は復号結果確保した特質に関する情報を逆量子化(inverse quantization)して、逆量子化された特質(又は特質値)を出力する。逆量子化はポイントクラウドエンコーダーの特質符号化に基づいて選択的に適用される。
【0141】
本発明においてRAHT変換部11007、LOD生成部11008及び/又は逆リフト部11009は、再構成されたジオメトリ及び逆量子化された特質を処理する。上述したように、RAHT変換部11007、LOD生成部11008及び/又は逆リフト部11009は、ポイントクラウドエンコーダーの符号化によってそれに対応する復号動作を選択的に行う。
【0142】
本発明による色逆変換部11010は、復号された特質に含まれた色値(又はテクスチャ)を逆変換するための逆変換コーディングを行う。色逆変換部11010の動作はポイントクラウドエンコーダーの色変換部40006の動作に基づいて選択的に行われる。
【0143】
図11のポイントクラウドデコーダーのエレメントは、図示していないが、ポイントクラウド提供装置に含まれた一つ又はそれ以上のメモリと通信可能に設定された一つ又はそれ以上のプロセッサ又は集積回路(integrated circuits)を含むハードウェア、ソフトウェア、ファームウェア又はこれらの組み合わせで具現される。一つ又はそれ以上のプロセッサは、上述した
図11のポイントクラウドデコーダーのエレメント動作及び/又は機能のうちのいずれかを行う。また、一つ又はそれ以上のプロセッサは、
図11のポイントクラウドデコーダーのエレメントの動作及び/又は機能を行うためのソフトウェアプログラム及び/又は指示(instruction)のセットを動作又は実行する。
【0144】
【0145】
図12に示した送信装置は、
図1の送信装置10000(又は
図4のポイントクラウドエンコーダー)の一例である。
図12に示した送信装置は、
図1ないし
図9で説明したポイントクラウドエンコーダーの動作及び符号化方法と同一又は類似する動作及び方法のうちのいずれかを行う。本発明による送信装置は、データ入力部12000、量子化処理部12001、ボクセル化処理部12002、八分木占有コード生成部12003、表面モデル処理部12004、イントラ/インターコーディング処理部12005、演算コーダー12006、メタデータ処理部12007、色相変換処理部12008、特質変換処理部(又は属性変換処理部)12009、予測/リフト/RAHT変換処理部12010、演算コーダー12011及び/又は送信処理部12012を含む。
【0146】
本発明によるデータ入力部12000はポイントクラウドデータを受信又は獲得する。データ入力部12000はポイントクラウドビデオ獲得部10001の動作及び/又は獲得方法(又は
図2に示した獲得過程20000)と同一又は類似する動作及び/又は獲得方法を行う。
【0147】
データ入力部12000、量子化処理部12001、ボクセル化処理部12002、八分木占有コード生成部12003、表面モデル処理部12004、イントラ/インターコーディング処理部12005及び演算コーダー12006はジオメトリ符号化を行う。本発明によるジオメトリ符号化は、
図1ないし
図9で説明したジオメトリ符号化と同一又は類似するので、具体的な説明は省略する。
【0148】
本発明による量子化処理部12001は、ジオメトリ(例えば、ポイントの位置値、又はポジション値)を量子化する。量子化処理部12001の動作及び/又は量子化は、
図4に示した量子化部40001の動作及び/又は量子化と同一又は類似する。具体的な説明は
図1ないし
図9に説明した通りである。
【0149】
本発明によるボクセル化処理部12002は、量子化されたポイントの位置値をボクセル化する。ボクセル化処理部120002は
図4に示した量子化部40001の動作及び/又はボクセル化過程と同一又は類似する動作及び/又は過程を行う。具体的な説明は
図1ないし
図9に説明した通りである。
【0150】
本発明による八分木占有コード生成部12003は、ボクセル化されたポイントの位置を八分木構造に基づいて八分木コーディングを行う。八分木占有コード生成部12003は占有コードを生成する。八分木占有コード生成部12003は
図4及び
図6で説明したポイントクラウドエンコーダー(又は八分木分析部40002)の動作及び/又は方法と同一又は類似する動作及び/又は方法を行う。具体的な説明は
図1ないし
図9に説明した通りである。
【0151】
本発明による表面モデル処理部12004は、表面モデル(surface model)に基づいて特定の領域(又はノード)内のポイントの位置をボクセル基盤に再構成するtrisoupジオメトリ符号化を行う。表面モデル処理部12004は
図4に示したポイントクラウドエンコーダー(例えば、表面近似分析部40003)の動作及び/又は方法と同一又は類似する動作及び/又は方法を行う。具体的な説明は
図1ないし
図9に説明した通りである。
【0152】
本発明によるイントラ/インターコーディング処理部12005は、ポイントクラウドデータをイントラ/インターコーディングする。イントラ/インターコーディング処理部12005は、
図7で説明したイントラ/インターコーディングと同一又は類似するコーディングを行う。具体的な説明は
図7に説明した通りである。本発明においてイントラ/インターコーディング処理部12005は演算コーダー12006に含まれる。
【0153】
本発明による演算コーダー12006は、ポイントクラウドデータの八分木及び/又は近似化された八分木をエントロピー符号化する。例えば、符号化方式は演算(Arithmetic)符号化方法を含む。演算コーダー12006は演算エンコーダー40004の動作及び/又は方法と同一又は類似する動作及び/又は方法を行う。
【0154】
本発明によるメタデータ処理部12007は、ポイントクラウドデータに関するメタデータ、例えば、設定値などを処理してジオメトリ符号化及び/又は特質符号化などの必要な処理過程に提供する。また本発明によるメタデータ処理部12007は、ジオメトリ符号化及び/又は特質符号化に関連するシグナリング情報を生成及び/又は処理する。本発明によるシグナリング情報はジオメトリ符号化及び/又は特質符号化とは別途に符号化処理される。また本発明によるシグナリング情報はインターリービングされることもある。
【0155】
色相変換処理部12008、特質変換処理部12009、予測/リフト/RAHT変換処理部12010及び演算コーダー12011は特質符号化を行う。本発明による特質符号化は、
図1ないし
図9で説明した特質符号化と同一又は類似するので具体的な説明は省略する。
【0156】
本発明による色相変換処理部12008は、特質に含まれた色相値を変換する色相変換コーディングを行う。色相変換処理部12008は再構成されたジオメトリに基づいて色相変換コーディングを行う。再構成されたジオメトリに関する説明は、
図1ないし
図9に説明した通りである。また
図4で説明した色変換部40006の動作及び/又は方法と同一又は類似する動作及び/又は方法を行う。具体的な説明は省略する。
【0157】
本発明による特質変換処理部12009は、ジオメトリ符号化が行われていない位置及び/又は再構成されたジオメトリに基づいて特質を変換する特質変換を行う。特質変換処理部12009は
図4に説明した特質変換部40007の動作及び/又は方法と同一又は類似する動作及び/又は方法を行う。具体的な説明は省略する。本発明による予測/リフト/RAHT変換処理部12010は変換された特質をRAHTコーディング、予測変換コーディング及びリフト変換コーディングのうちのいずれか一つ又は組み合わせてコーディングする。予測/リフト/RAHT変換処理部12010は
図4に説明したRAHT変換部40008、LOD生成部40009及びリフト変換部40010の動作と同一又は類似する動作のうちのいずれかを行う。また、予測変換コーディング、リフト変換コーディング及びRAHT変換コーディングに関する説明は
図1ないし
図9に説明した通りであるので、具体的な説明は省略する。
【0158】
本発明による演算コーダー12011は、コーディングされた特質を演算コーディングに基づいて符号化する。演算コーダー12011は演算エンコーダー400012の動作及び/又は方法と同一又は類似する動作及び/又は方法を行う。
【0159】
本発明による送信処理部12012は、符号化されたジオメトリ及び/又は符号化された特質、メタデータ情報を含む各ビットストリームを送信するか、又は符号化されたジオメトリ及び/又は符号化された特質、メタデータ情報を一つのビットストリームで構成して送信する。本発明による符号化されたジオメトリ及び/又は符号化された特質、メタデータ情報が一つのビットストリームで構成された場合、ビットストリームは一つ又はそれ以上のサブビットストリームを含む。本発明によるビットストリームはシーケンスレベルのシグナリングのためのSPS(Sequence Parameter Set)、ジオメトリ情報コーディングのシグナリングのためのGPS(Geometry Parameter Set)、特質情報コーディングのシグナリングのためのAPS(Attribute Parameter Set)、タイルレベルのシグナリングのためのTPS(Tile Parameter Set)を含むシグナリング情報及びスライスデータを含む。スライスデータは一つ又はそれ以上のスライスに関する情報を含む。本発明による一つのスライスは一つのジオメトリビットストリーム(Geom00)及び一つ又はそれ以上の特質ビットストリーム(Attr00、Attr10)を含む。
【0160】
スライス(slice)とは、コーディングされたポイントクラウドフレームの全体又は一部を示すシンタックスエレメントのシリーズをいう。
【0161】
本発明によるTPSは一つ又はそれ以上のタイルに対してそれぞれのタイルに関する情報(例えば、bounding boxの座標値情報及び高さ/サイズ情報など)を含む。ジオメトリビットストリームはヘッダとペイロードを含む。本発明によるジオメトリビットストリームのヘッダはGPSに含まれたパラメータセットの識別情報(geom_parameter_set_id)、タイル識別子(geom_tile_id)、スライス識別子(geom_slice_id)及びペイロードに含まれたデータに関する情報などを含む。上述したように、本発明によるメタデータ処理部12007はシグナリング情報を生成及び/又は処理して送信処理部12012に送信することができる。本発明において、ジオメトリ符号化を行うエレメント及び特質符号化を行うエレメントは、点線処理したように、相互データ/情報を共有することができる。本発明による送信処理部12012は送信機10003の動作及び/又は送信方法と同一又は類似する動作及び/又は送信方法を行う。具体的な説明は
図1及び
図2に説明した通りであるので、省略する。
【0162】
【0163】
図13に示した受信装置は、
図1の受信装置10004(又は
図10及び
図11のポイントクラウドデコーダー)の一例である。
図13に示した受信装置は、
図1ないし
図11で説明したポイントクラウドデコーダーの動作及び復号方法と同一又は類似する動作及び方法のうちのいずれかを行う。
【0164】
本発明による受信装置は、受信部13000、受信処理部13001、演算(arithmetic)デコーダー13002、占有コード(Occupancy code)基盤の八分木再構成処理部13003、表面モデル処理部(三角形再構成、アップサンプリング、ボクセル化)13004、逆(inverse)量子化処理部13005、メタデータパーサ13006、演算(arithmetic)デコーダー13007、逆量子化処理部13008、予測/リフト/RAHT逆変換処理部13009、色相逆変換処理部13010及び/又はレンダラー13011を含む。本発明による復号の各構成要素は本発明による符号化の構成要素の逆過程を行う。
【0165】
本発明による受信部13000は、ポイントクラウドデータを受信する。受信部13000は
図1の受信機10005の動作及び/又は受信方法と同一又は類似する動作及び/又は受信方法を行う。具体的な説明は省略する。
【0166】
本発明による受信処理部13001は受信したデータからジオメトリビットストリーム及び/又は特質ビットストリームを得る。受信処理部13001は受信部13000に含まれる。
【0167】
演算デコーダー13002、占有コード基盤の八分木再構成処理部13003、表面モデル処理部13004及び逆量子化処理部13005はジオメトリ復号を行う。本発明によるジオメトリ復号は
図1ないし
図10で説明したジオメトリ復号と同一又は類似するので、具体的な説明は省略する。
【0168】
本発明による演算デコーダー13002はジオメトリビットストリームを演算コーディングに基づいて復号する。演算デコーダー13002は演算デコーダー11000の動作及び/又はコーディングと同一又は類似する動作及び/又はコーディングを行う。
【0169】
本発明による占有コード基盤の八分木再構成処理部13003は、復号されたジオメトリビットストリームから(又は復号結果、確保されたジオメトリに関する情報)から占有コードを獲得して八分木を再構成する。占有コード基盤の八分木再構成処理部13003は、八分木合成部11001の動作及び/又は八分木生成方法と同一又は類似する動作及び/又は方法を行う。本発明による表面モデル処理部13004はtrisoupジオメトリ符号化が適用された場合、表面モデル方式に基づいてtrisoupジオメトリ復号及びそれに関連するジオメトリ再構成(例えば、三角形再構成、アップサンプリング、ボクセル化)を行う。表面モデル処理部13004は表面近似合成部11002及び/又はジオメトリ再構成部11003の動作と同一又は類似する動作を行う。
【0170】
本発明による逆量子化処理部13005は復号されたジオメトリを逆量子化する。
【0171】
本発明によるメタデータパーサ13006は受信したポイントクラウドデータに含まれたメタデータ、例えば、設定値などを分析する。メタデータパーサ13006はメタデータをジオメトリ復号及び/又は特質復号に伝達する。メタデータに関する具体的な説明は
図12で説明した通りであるので省略する。
【0172】
演算デコーダー13007、逆量子化処理部13008、予測/リフト/RAHT逆変換処理部13009及び色相逆変換処理部13010は特質復号を行う。特質復号は
図1なしい
図10で説明した特質復号と同一又は類似するので、具体的な説明は省略する。
【0173】
本発明による演算デコーダー13007は、特質ビットストリームを演算コーディングに復号する。演算デコーダー13007は再構成されたジオメトリに基づいて特質ビットストリームの復号を行う。演算デコーダー13007は演算デコーダー11005の動作及び/又はコーディングと同一又は類似する動作及び/又はコーディングを行う。
【0174】
本発明による逆量子化処理部13008は、復号された特質ビットストリームを逆量子化する。逆量子化処理部13008は逆量子化部11006の動作及び/又は逆量子化方法と同一又は類似する動作及び/又は方法を行う。
【0175】
本発明による予測/リフト/RAHT逆変換処理部13009は、再構成されたジオメトリ及び逆量子化された特質を処理する。予測/リフト/RAHT逆変換処理部13009は、RAHT変換部11007、LOD生成部11008及び/又は逆リフト部11009の動作及び/又は復号と同一又は類似する動作及び/又は復号のうちのいずれかを行う。本発明による色相逆変換処理部13010は、復号された特質に含まれた色値(又はテクスチャ)を逆変換するための逆変換コーディングを行う。色相逆変換処理部13010は色逆変換部11010の動作及び/又は逆変換コーディングと同一又は類似する動作及び/又は逆変換コーディングを行う。本発明によるレンダラー13011はポイントクラウドデータをレンダリングする。
【0176】
図14は本発明によるポイントクラウドデータの送受信方法/装置に連動可能な構造の一例を示す図である。
【0177】
図14の構造はサーバー1460、ロボット1410、自律走行車両1420、XR装置1430、スマートフォン1440、家電1450及び/又はHMD1470のうちのいずれかがクラウドネットワーク1410に連結された構成を示している。ロボット1410、自律走行車両1420、XR装置1430、スマートフォン1440又は家電1450などは装置とも呼ばれる。またXR装置1430は本発明によるポイントクラウドデータ(PCC)装置に対応するか又はPCC装置に連動する。
【0178】
クラウドネットワーク1400はクラウドコンピューティングインフラの一部を構成するか、又はクラウドコンピューティングインフラ内に存在するネットワークを意味する。ここで、クラウドネットワーク1400は3Gネットワーク、4G又はLTEネットワーク又は5Gネットワークなどを用いて構成される。
【0179】
サーバー1460はロボット1410、自律走行車両1420、XR装置1430、スマートフォン1440、家電1450及び/又はHMD1470のいずれかにクラウドネットワーク1400により連結され、連結された装置1410~1470のプロセシングの少なくとも一部を助けることができる。
【0180】
HMD(Head-Mount Display)1470は本発明によるXRデバイス及び/又はPCCデバイスが具現されるタイプのうちのいずれかを示す。本発明によるHMDタイプのデバイスは、コミュニケーションズユニット、コントロールユニット、メモリユニット、I/Oユニット、センサユニット及びパワー供給ユニットなどを含む。
【0181】
以下、上記技術が適用される装置1410~1450の様々な本発明について説明する。ここで、
図14に示した装置1410~1450は上述した本発明によるポイントクラウドデータ送受信装置に連動/結合することができる。
【0182】
<PCC+XR>
【0183】
XR/PCC装置1430はPCC及び/又はXR(AR+VR)技術が適用されて、HMD(Head-Mount Display)、車両に備えられたHUD(Head-Up Display)、TV、携帯電話、スマートフォン、コンピューター、ウェアラブルデバイス、家電機器、デジタル看板、車両、固定型ロボットや移動型ロボットなどに具現されることもできる。
【0184】
XR/PCC装置1430は、様々なセンサにより又は外部装置から獲得した3次元ポイントクラウドデータ又はイメージデータを分析して3次元ポイントに対する位置データ及び特質データを生成することにより周辺空間又は現実オブジェクトに関する情報を得て、出力するXR客体をレンダリングして出力することができる。例えば、XR/PCC装置1430は認識された物体に関する追加情報を含むXR客体を該当認識された物体に対応して出力することができる。
【0185】
<PCC+XR+モバイルフォン>
【0186】
XR/PCC装置1430はPCC技術が適用されてモバイルフォン1440などで具現される。
【0187】
モバイルフォン1440はPCC技術に基づいてポイントクラウドコンテンツを復号し、ディスプレイする。
【0188】
<PCC+自立走行+XR>
【0189】
自律走行車両1420はPCC技術及びXR技術が適用されて、移動型ロボット、車両、無人飛行体などで具現される。
【0190】
XR/PCC技術が適用された自律走行車両1420は、XR映像を提供する手段を備えた自律走行車両やXR映像内での制御/相互作用の対象となる自律走行車両などを意味する。特に、XR映像内での制御/相互作用の対象となる自律走行車両1420はXR装置1430とは区分されて互いに連動される。
【0191】
XR/PCC映像を提供する手段を備えた自律走行車両1420は、カメラを含むセンサからセンサ情報を得、得たセンサ情報に基づいて生成されたXR/PCC映像を出力する。例えば、自律走行車両1420はHUDを備えてXR/PCC映像を出力することにより、搭乗者に現実オブジェクト又は画面内のオブジェクトに対応するXR/PCC客体を提供することができる。
【0192】
この時、XR/PCC客体がHUDに出力される場合には、XR/PCC客体の少なくとも一部が搭乗者の視線が向く実際の客体にオーバーラップされるように出力される。反面、XR/PCC客体が自律走行車両内に備えられるディスプレイに出力される場合には、XR/PCC客体の少なくとも一部が画面内の客体にオーバーラップされるように出力される。例えば、自律走行車両1220は車路、他の車両、信号灯、交通表示板、二輪車、歩行者、建物などのような客体に対応するXR/PCC客体を出力することができる。
【0193】
本発明によるVR(Virtual Reality)技術、AR(Augmented Reality)技術、MR(Mixed Reality)技術及び/又はPCC(Point Cloud Compression)技術は、様々なデバイスに適用可能である。
【0194】
即ち、VR技術は現実の客体や背景などをCG映像のみで提供するディスプレイ技術である。反面、AR技術は実際物事の映像上に仮想のCG映像を共に見せる技術である。また、MR技術は現実世界に仮想客体を混ぜて見せるという点では上記AR技術と類似する。しかし、AR技術では現実の客体とCG映像からなる仮想の客体の区別が明らかであり、現実客体を補完する形態で仮想の客体を使用する反面、MR技術では仮想の客体と現実の客体が同様の性格と見なされるという点でAR技術とは区別される。より具体的には、例えば、上記MR技術が適用されたことがホログラムサービスである。
【0195】
但し、最近にはVR、AR、MR技術を明確に区別するよりは、XR(extended Reality)技術とも呼ぶ。よって、本発明の本発明はVR、AR、MR、XR技術のいずれにも適用可能である。かかる技術はPCC、V-PCC、G-PCC技術基盤の符号化/復号が適用される。
【0196】
本発明によるPCC方法/装置は自律走行サービスを提供する車両に適用できる。
【0197】
自律走行サービスを提供する車両はPCCデバイスと有無線通信可能に連結される。
【0198】
本発明によるポイントクラウドデータ(PCC)送受信装置は、車両と有無線通信可能に連結された場合、自律走行サービスと共に提供できるAR/VR/PCCサービス関連コンテンツデータを受信/処理して車両に送信することができる。またポイントクラウドデータ送受信装置車両に搭載された場合は、ポイントクラウド送受信装置はユーザインターフェース装置で入力されたユーザ入力信号によってAR/VR/PCCサービス関連コンテンツデータを受信/処理してユーザに提供することができる。本発明による車両又はユーザインターフェース装置はユーザ入力信号を受信する。本発明によるユーザ入力信号は自律走行サービスを指示する信号を含む。
【0199】
図1ないし
図14で説明したように、ポイントクラウドデータはポイントの集合からなり、各ポイントはジオメトリデータ(ジオメトリ情報)と特質データ(特質情報)を有する。ジオメトリデータは各ポイントの3次元位置情報である(例えば、x、y、z軸の座標値)。即ち、各ポイントの位置は3次元空間を表す座標系上のパラメータ(例えば、空間を表す3つの軸であるX軸、Y軸及びZ軸のパラメータ(x,y,z))で表現される。また特質情報はポイントの色相(RGB,YUVなど)、反射度(reflectance)、法線(normal vectors)、透明度(transparency)などを意味する。特質情報はスカラー又はベクトルの形態で表現される。
【0200】
本発明によれば、ポイントクラウドデータはポイントクラウドデータの種類及び取得方法によって、的ポイントクラウドデータのカテゴリー1、動的ポイントクラウドデータのカテゴリー2、及び動的に動きながら得たカテゴリー3に分類される。カテゴリー1はオブジェクトや空間に対してポイント密度が高い単一フレームのポイントクラウドで構成される。カテゴリー3のデータは移動しながら得られた多数のフレームを有するフレーム基盤のデータ、及び大規模空間に対してライダー(LiDAR)センサーから得られたポイントクラウドと2D映像から得られた色相映像が整合した単一フレームの融合(fused)データに区分される。
【0201】
本発明によれば、多数のフレームを有するフレーム基盤のポイントクラウドデータのように時間に従うマルチフレーム(multiple frames)を有する3次元ポイントクラウドデータを効率的に圧縮するために、インター予測(inter prediction)コーディング/復号が使用される。インター予測コーディング/復号はジオメトリ情報及び/又は特質情報に適用できる。インター予測は画面間予測又はフレーム間予測であり、イントラ予測は画面内予測である。
【0202】
以下、インター予測技術に関連する動き検出(motion estimation)方法について説明する。
【0203】
インター予測では符号化されたフレームから現在フレーム(current frame)との類似度が高い情報を活用して現在フレームの全部又は一部を予測する。このとき、類似度を判断する単位を予測ユニット(Prediction Unit,PU)という。インター予測は時間に応じて得られた複数のフレームの間の動きを用いる予測方式であり、かかる技術を動きベクトル検出(motion vector estimation)又は動き検出(motion estimation)という。
【0204】
動き検出はフレーム全体を回転、移動、拡大及び/又は縮小する方式のグローバル動き検出(global motion estimation)と、フレームの一部の動きを予測するローカル動き検出(local motion estimation)に区分される。
【0205】
動き検出は現在フレームの空間を予測ユニット(PU)に分割して該当領域に含まれているポイントを抽出し、対応する参照フレームの該当領域に含まれているポイントを抽出した後、抽出された現在フレームのポイントと抽出された参照フレームのポイントの間の組み合わせの距離(distance)及び/又はベクトル差(vector difference)を計算する。このとき、特定値よりも小さいベクトル差をターゲットベクトル差(target vector difference)として設定する。
【0206】
また、互いに方向の異なる多数のユニットベクトル(unit vector)からなるユニットベクトルの集合に対して、任意の値であるアマウント(amount)を各ユニットベクトルごとにかけることによってターゲットベクトル差と最も近い(類似する)ベクトル(ユニットベクトルxアマウント)を探索することができる。
【0207】
このとき、アマウントが初期の任意値から所定の最小値まで段階的に小さくなりつつ、上述した類似ベクトル探索過程が複数回繰り返される。探索過程の繰り返しにより最終的に探索されたベクトルがベストベクトルとして設定され、RDO(Rate Distortion Optimization)方式で費用(cost)が算出される。
【0208】
予測ユニット(PU)は多数のサブ予測ユニット(sub-PU)に分割でき、分割されたサブ予測ユニット(sub-PU)で上述したベストベクトル探索過程が行われる。分割されたサブ予測ユニット(sub-PU)のRDO costを計算して算出した合計が予測ユニット(PU)のRDO cost値よりも小さいと、該当予測ユニット(PU)はサブ予測ユニットに最終的に分割され、そうではないと、該当予測ユニット(PU)のベストベクトルがシグナリングされる。
【0209】
一方、この明細書で開示する本発明はポイントクラウドデータの符号化及び復号に関し、複数のフレーム間の連関性を探索し、符号化/復号時の参照フレームのコンテキストを連続して符号化/復号することにより、ポイントクラウドデータの送受信効率を向上させる装置/方法である。本発明によるポイントクラウドデータの送受信装置/方法はフレーム間の予測に関連する情報を用いてビットストリームの圧縮効率を向上させる。
【0210】
図15は本発明によるポイントクラウドデータのGoF(Group of Frames)の例示である。GoF(Group of Frames)はフレームのグループを示し、GoP(Group of Pictures)とも称される。GoFを構成するフレームはイントラフレーム(intra frame,I frame)、予測フレーム(predicted frame,P frame)及び/又は両方向予測フレーム(bidirectional frame,B frame)を含む。イントラフレーム(Iフレーム)は他のフレームを参照しないフレームである。IフレームはGoF内での最初のフレームであるので、以前のフレームがなく、他のフレームを参照しない。予測フレーム(Pフレーム)は以前のIフレーム又は他のPフレームを参照して予測されたフレームである。両方向予測フレーム(Bフレーム)は両方向にIフレーム又はPフレームを参照して予測されたフレームである。例えば、0番目ないし3番目のフレームのうち、2番目のフレームが1番目のフレームと3番目のフレームを全て参照する場合、2番目のフレームは両方向予測フレームに該当する。GoFはIフレーム、Pフレーム及び/又はBフレームで構成され、Iフレームから始まるGoFグループは様々な形態で定義できる。ここで、参照フレームはインター予測のために参照されたフレームである。GoFはIフレームから始まるフレームのグループであって符号化/復号の単位になる。
【0211】
本発明によるポイントクラウドデータ送信装置/受信装置は、フレーム間の連関性を探索してフレーム間の予測時の重複情報をシグナリングに代替することができ、類似するジオメトリ/特質コンテキストを有するフレームのインデックス情報を用いてコンテキスト連続フラグを使用することができる。
【0212】
ポイントクラウドデータの圧縮方法にはイントラフレームコーディング(intra frame coding)及びインターフレームコーディング(inter frame coding)の2つの方法がある。ポイントクラウドデータのうち、カテゴリー3はインターフレームコーディングに適用できるデータであって、連続するフレームの集合からなる。かかるフレームの集合をGoF(Group of Frame)と定義し、GoFは定義方法によってIPPP,IPPBPP,IBBPBBなどの形態になり、符号化又は復号される。
【0213】
例えば、
図15はIPPP形態のGoFを示している。
図15に示した2つのGoFのうち、左側のGoFはPフレームが直前のフレームを参照している。即ち、1番目のPフレームは0番目のIフレームを参照し、2番目のPフレームは1番目のPフレームを参照する。
図15の右側に示すGoFは1番目ないし3番目のPフレームが0番目のIフレームを参照することを示している。即ち、Pフレームは以前のフレームを参照し、最初のIフレームを参照することができる。又はPフレームはフレームインデックス情報によりIフレーム又は特定のPフレームを参照することができる。
【0214】
ポイントクラウドデータはポイントの集合からなり、各ポイントはジオメトリ情報と特質情報を含む。ポイントクラウドデータの符号化(encoding)過程はジオメトリを圧縮し、圧縮により変更された位置情報で再構成されたジオメトリ(reconstructed geometry、復号されたジオメトリ)に基づいて特質情報を圧縮する過程で構成される。ポイントクラウドデータ復号(decoding)は符号化されたジオメトリビットストリームと特質ビットストリームが送信されてジオメトリを先に復号し、復号により再構成されたジオメトリに基づいて特質情報を復号する過程により進行される。
【0215】
本発明によるポイントクラウドデータ送信装置/受信装置は、ポイントクラウドデータ符号化/復号時、コンテキスト連続性の適用有無などの関連情報のシグナリング方法を提案する。本発明によるポイントクラウドデータ送信装置/受信装置は、フレーム間の連関性を探索して連関性のある参照フレームを導き出し、GoF内で参照フレームのコンテキストの連続性に基づいてポイントクラウドデータを符号化/復号する。また本発明によれば、コンテキストの連続性を用いたフレーム間の符号化/復号方法として、参照フレームのインデックスをシグナリングする方案が提示される。本発明によるポイントクラウドデータ送信装置/受信装置は、ポイントクラウドデータの圧縮効率を高めるためのGoFフレーム構造を提案し、GoF内でフレーム間の連関性を探索することを提案する。また本発明ではGoF内で参照フレームのコンテキスト連続性を適用したデータの符号化/復号を提案し、コンテキスト連続性の適用に関連して参照フレームのインデックスをシグナリングする方案を提案する。ここで、参照フレームは現在フレームとの連関性があるフレームを示す。
【0216】
GoFのフレームに対してコンテキスト連続性を適用するとは、符号化/復号時に連関性のある参照フレームのコンテキスト情報(コンテキストモデル(context model)又は算術符号化確率モデル(arithmetic model)、確率区間情報)を連続して使用することを意味する。本発明によるポイントクラウドデータ送信装置/受信装置は、ポイントクラウドデータの符号化/復号時に現在フレームと他のフレームの間の連関性を探索して、連関性のあるフレーム、即ち、参照フレームのコンテキストを連続して使用することができる。コンテキストの連続性を利用できるか否か(フレーム間連関性があるか否か)は、GoF構造の内部又は外部で定義される。本発明による送信装置/受信装置は、現在フレームの符号化/復号時に現在フレームと連関性のある参照フレームがある場合、参照フレームのコンテキスト情報を用いて現在フレームを符号化/復号することができる。即ち、コンテキスト連続性を適用して現在フレームを符号化/復号することができる。
【0217】
以下、上述した符号化について説明する。
【0218】
算術符号化は無損失圧縮に使用されるエントロピー符号化アルゴリズムの1つである。算術符号化は全体メッセージを1つの実数nに置き換えることができる。
【0219】
算術符号化は0.0~1.0区間をメッセージに出現する記号の出現確率に基づいて分けることができる。例えば、メッセージにおいて"a"記号の出現確率が60%,“b"記号の出現確率が20%,"c"記号の出現確率が20%である場合、最初の段階で0.0~1.0区間は"a"記号の出現確率を示す0.0~0.6区間、"b"記号の出現確率を示す0.6~0.8区間、そして"c"記号の出現確率を示す0.8~1.0区間に分けられる。このとき、0.0~1.0のような確率区間を分ける比率を確率モデル(又は確率モード)又はコンテキストモデル(context model)という。
【0220】
例えば、記号"abc"を算術符号化する場合、最初に符号化する記号が"a"であるので、0.0~0.6区間に該当し、次の段階で"a"に該当する0.0~0.6区間は再度60%,20%,20%の比率で分けられる。したがって、0.0~0.6区間は0.0~0.36区間、0.36~0.48区間、及び0.48~0.6区間に分けられる。次に、2番目に符号化する記号が"b"であるので、0.36~0.48区間に該当する。"b"に該当する0.36~0.48区間を再度60%,20%,20%の比率で分けると、0.36~0.432区間、0.432~0.456区間及び0.456~0.48区間に分けられる。その後、3番目に符号化する記号は"c"であるので、0.456~0.48区間に該当する。即ち、算術符号化は符号化する記号に対応する区間を確率モデル又はコンテキストモデルによって再度分け、その後に符号化する記号によって分けられた区間のいずれかを選択する。この過程を繰り返すことにより算術符号化が行われる。
【0221】
上記の例において、メッセージ"abc"の符号化後に導き出された確率区間は0.456~0.48区間に該当する。よって、メッセージ"abc"は該当区間内の実数値に符号化される。例えば、実数0.47は"abc"を示す。0.47値は本発明による復号器に伝達され、復号器はコンテキストモデルによって分けられた確率区間において0.47の値がどの確率区間に属するかを確認することにより該当確率区間に対応する記号にメッセージを復号することができる。
【0222】
確率モデル(又は確率モード)又はコンテキストモデルは、算術符号化アルゴリズムによって初期に定められたモデルが使用されるか、又は符号化/復号時の記号の出現確率を探索して設定されたモデルである。確率モデル又はコンテキストモデルは符号化/復号の過程でアップデートすることができる。
【0223】
本発明によるポイントクラウドデータ送信装置/受信装置においてフレームの符号化/復号時にコンテキスト連続性を適用するとは、参照フレームを算術符号化(arismetic coding)して算出した確率区間に連続して現在フレームを符号化することを示す。例えば、参照フレームを算術符号化しながら最後に導き出された確率区間が0.456~0.48区間である場合、該当0.456~0.48区間を再度コンテキストモデル又は確率モデルによって分けて現在フレームを連続して符号化することができる。即ち、フレームごとに確率区間又はコンテキストモデルが初期化されることではなく、連関性探索によって導き出された参照フレームの確率区間に連続して現在フレームを符号化/復号する。
【0224】
本発明によるポイントクラウドデータの送信装置/受信装置は、符号化/復号時、CABAC(context-adaptive binary arithmetic coding)を使用する。フレーム算術符号化に使用するコンテキストモデル(又は確率モード)はフレームごとに初期化されるか、又は連関性のある参照フレームで使用された確率モードが現在フレームで再度使用される。また連関性のある参照フレームで導き出された確率区間に連続して現在フレームを符号化するか、又は確率区間情報を用いて現在フレームを復号することができる。フレーム間に類似する特性がある場合、確率モードを再度使用すると、シンボル間の重複性を活用できるので圧縮効率が高くなる。参照フレームで使用された確率モードと同一の確率モードを使用するとは、参照フレームのコンテキストモデルを使用することと同じ意味である。CABAC以外に、Arithmetic coding、Huffman coding又はRange coding方式の場合にも、フレーム間の連関性探索に基づいて参照フレームの確率モード又はコンテキストモデルを再使用することができいる。
【0225】
本発明によるポイントクラウドデータの送信装置/受信装置がフレーム間の連関性を判断する基準は以下の通りである。
【0226】
フレーム間の連関性の判断はGoFを構成するフレームのタイプによって異なる。例えば、Iフレームはグループ内の最初のフレームであり、連関性のある参照フレームがなく、連続して使用できるコンテキストモデルが存在しないものと判断される。Iフレームを参照するPフレームはIフレームから動き検出、動き補正されて予測されるので、Iフレームとは連関性が低いと判断される。反面、同一のIフレームから予測された互いに異なる2つのPフレームの場合は、Pフレームの間に互いに連関性が高いと判断される。
【0227】
また、フレーム間の連関性は現在フレームと以前のフレームの間のグローバル動きベクトル(global motion vector)の差に基づいて判断される。グローバル動きベクトルはフレームが含む全体ポイントクラウドデータに対する動きベクトルである。フレーム間のグローバル動きベクトルの差と任意に設定された特定のしきい値を比較することにより、フレーム間の連関性有無を判断することができる。同様に、フレーム間の連関性は現在フレームと以前のフレームの間のローカル動きベクトル(local motion vector)の差に基づいて判断される。ローカル動きベクトルはフレーム内の一部のオブジェクトに対する動きベクトルである。フレーム間のローカル動きベクトルの差の総合と任意に設定された特定のしきい値を比較することにより、フレーム間の連関性有無を判断することができる。
【0228】
フレーム間の連関性は以前のフレームと現在フレームのポイント、ジオメトリ及び/又は特質値の間のRDO(rate-distortion optimization)値に基づいて判断される。また以前のフレームと現在フレームの間の道路(road)又はその他の物体(object)の動きベクトル値や動き補正(motion compensated)値の変化量に基づいてフレーム間の連関性が判断される。
【0229】
以前のフレームは現在フレームの直前のフレームを称するか、又はそれより以前のフレームを称する。現在フレームと連関性の高い参照フレームに関する情報はインデックスで本発明によるポイントクラウドデータ受信装置に伝達される。現在フレームの符号化時、現在フレームと連関性の高い参照フレームの確率モデルを連続して使用した場合、連関性の高い参照フレームに関するインデックス情報が復号器に伝達され、復号器は伝達されたインデックス情報に基づいて現在フレームを復号する。
【0230】
本発明によるポイントクラウドデータ送信装置/受信装置は、現在フレームに対して連関性のある参照フレームのコンテキストモデル又は確率モデルを共有して符号化/復号する。符号化器は連関性のある参照フレームのコンテキストを連続して現在フレームのジオメトリ情報と特質情報を符号化する。復号器は連関性のある参照フレームから連続して使用されたコンテキストを使用して現在フレームを復号する。
【0231】
本発明によるポイントクラウドデータ送信装置/受信装置は、連関性のある参照フレームのコンテキスト又は確率モデルを連続して使用する場合、どのフレームのコンテキスト又は確率モデルを使用したかインデックス情報を送信/受信する。連関性のある参照フレームのインデックス情報は現在フレームから参照フレームまでの距離、Iフレームから参照フレームまでの距離又は開始フレームからのフレーム数に基づいてインデックスが定められる。
【0232】
図16は本発明によるポイントクラウドデータ送信装置16000の一例を示す。
【0233】
本発明によるポイントクラウドデータ送信装置16000(例えば、
図1、
図4、
図12又は
図18で説明したポイントクラウドエンコーダー又は送信装置)は、
図1ないし
図14で説明した符号化動作を行う。本発明によるポイントクラウドデータ送信装置16000は
図16には示していないが、
図1ないし
図14で説明した符号化動作を行うための1つ又はそれ以上の構成要素をさらに含む。
【0234】
本発明によるポイントクラウドデータ送信装置16000(例えば、
図1、
図4、
図12又は18で説明したエンコーダー又は送信装置)は、コンテキスト連続性判別及び格納部を含む。コンテキスト連続性判別及び格納部はジオメトリコンテキスト連続性判別及び格納部16001及び特質コンテキスト連続性判別及び格納部16002を含む。
【0235】
コンテキスト連続性判別及び格納部は符号化する現在フレームのコンテキスト連続性の適用有無を判断する。このとき、コンテキスト連続性の適用有無は現在フレームと連関性のある参照フレームがあるか否かによって判断される。連関性のある参照フレームがある場合、現在フレームはコンテキスト連続性を適用して符号化される。コンテキスト連続性判別及び格納部はフレーム間の連関性探索により現在フレームに連関性のある参照フレームを導き出す。またコンテキスト連続性判別及び格納部はコンテキスト情報(確率区間情報、コンテキストモデル及び確率モデル情報のいずれ)が連続して使用される参照フレームのインデックス情報、コンテキスト連続性の適用有無に関する情報を本発明によるポイントクラウドデータ受信装置(例えば、
図1、
図10、
図11、
図19のデコーダー又は受信装置)に伝達する。
【0236】
コンテキスト連続性判別及び格納部はコンテキスト連続性を使用した参照フレーム及び現在フレームのインデックスをシグナリングする。ジオメトリ情報符号化過程での連関性のある参照フレームのインデックス情報と特質情報符号化過程での連関性のある参照フレームのインデックス情報は互いに異なる。またコンテキスト連続性判別及び格納部は参照フレームの算術符号化により導き出されたコンテキスト情報(確率区間情報、コンテキストモデル及び確率モデル情報のいずれ)を格納する。したがって、本発明によるArithmeticコーダで現在フレームの算術符号化時、参照フレームの確率区間情報とコンテキストモデルを連続して使用することができる。即ち、Arithmeticコーダでコンテキスト連続性を使用することができる。
【0237】
図17は本発明によるポイントクラウドデータ受信装置17000の一例を示す。
【0238】
本発明によるポイントクラウドデータ受信装置17000(例えば、
図1、
図10、
図11又は
図19で説明したポイントクラウドデコーダー又は受信装置)は、
図1ないし
図14で説明した復号動作を行う。またポイントクラウドデータ受信装置17000は、
図16で説明したポイントクラウドデータ送信装置16000の符号化動作の逆過程に該当する復号動作を行う。本発明によるポイントクラウドデータ受信装置17000は
図17には示していないが、
図1ないし
図14で説明した復号動作を行うための1つ又はそれ以上の構成要素をさらに含む。
【0239】
本発明によるポイントクラウドデータ受信装置17000はコンテキスト連続性処理部を含む。コンテキスト連続性処理部はジオメトリコンテキスト連続性処理部17001及び特質コンテキスト連続性処理部17002を含む。
【0240】
本発明によるポイントクラウドデータ受信装置17000は、コンテキスト連続性を用いる現在フレームのインデックス情報と参照フレームのインデックス情報を使用してジオメトリ情報又は特質情報を復号する。即ち、受信装置17000は受信したインデックス情報に該当する参照フレームのコンテキスト情報(確率区間、コンテキストモデル又は確率モデル)に基づいて現在フレームのポイントクラウドデータを復号する。ジオメトリ情報又は特質情報の復元過程は、
図16のジオメトリコンテキスト連続性判別及び格納部16001と特質コンテキスト連続性判別及び格納部16002で行う過程の逆過程に対応する。
【0241】
本発明によるコンテキスト連続性処理部はポイントクラウドデータのフレームのコンテキスト連続性の適用有無を判断する。本発明によるポイントクラウドデータ受信装置17000は参照フレームのインデックス情報又はフレームのコンテキスト連続性の適用有無に関する情報を含むビットストリームを受信する。コンテキスト連続性処理部は受信した情報に基づいて現在フレームに対するコンテキスト連続性の適用有無を判断する。コンテキスト連続性の適用有無は現在フレームと連関性のある参照フレームがあるか否かによって判断されてもよい。コンテキスト連続性処理部は参照フレームのインデックス情報がある場合、現在フレームに対してコンテキスト連続性が適用されたと判断する。現在フレームに対してコンテキスト連続性が適用された場合、受信装置17000は参照フレームのコンテキスト情報(確率区間、コンテキストモデル又は確率モデル)に基づいて現在フレームを復号する。またコンテキスト連続性処理部はフレームのコンテキスト情報を格納する。格納されたコンテキスト情報は受信装置17000で他のフレームを復号するときに使用される。
【0242】
図18は本発明によるポイントクラウドデータ送信装置18000の一例を示す。
【0243】
本発明によるポイントクラウドデータ送信装置18000(例えば、
図1、
図4、
図12又は
図16で説明したポイントクラウドエンコーダー又は送信装置)は、
図1ないし
図16で説明した符号化動作を行う。本発明によるポイントクラウドデータ送信装置18000は
図18には示していないが、
図1ないし
図16で説明した符号化動作を行うための1つ又はそれ以上の構成要素をさらに含む。
【0244】
本発明によるポイントクラウドデータ送信装置18000(例えば、
図1、
図4、
図12又は
図16で説明したエンコーダー又は送信装置)は、コンテキスト連続性判別及び格納部18001,18002を含む。コンテキスト連続性判別及び格納部18001,18002については
図16で説明した内容と重複するので説明を省略する。
【0245】
図18を参照すると、Iフレームからグローバル動き検出/補正(global motion estimation/compensation)又はローカル動き検出/補正(local motion estimation/compensation)が行われてPフレーム又はBフレームが予測される。コンテキスト連続性判別及び格納部18001,18002はフレーム間の連関性を探索して現在フレームに対する参照フレームを導き出し、Arithmeticコーダで算術符号化時に使用したコンテキスト情報(確率区間情報、コンテキストモデル又は確率モデル)を格納する。格納されたコンテキスト情報はArithmeticコーダでフレームを符号化するときに使用される。即ち、現在フレームは格納された参照フレームのコンテキスト情報に基づいてコンテキストが連続して符号化される。
【0246】
図19は本発明によるポイントクラウドデータ受信装置19000の一例を示す。
【0247】
本発明によるポイントクラウドデータ受信装置19000(例えば、
図1、
図10、
図11又は
図17で説明したポイントクラウドデコーダー又は受信装置)は、
図1ないし
図17で説明した復号動作を行う。またポイントクラウドデータ受信装置19000は
図17で説明したポイントクラウドデータ受信装置17000の符号化動作の逆過程に該当する復号動作を行う。本発明によるポイントクラウドデータ受信装置19000は
図19には示していないが、
図1ないし
図17で説明した復号動作を行うための1つ又はそれ以上の構成要素をさらに含む。
【0248】
本発明によるポイントクラウドデータ受信装置19000はコンテキスト連続性処理部19001,19002を含む。受信装置19000は現在フレームのインデックス情報と参照フレームのインデックス情報を使用してジオメトリ情報又は特質情報を復号する。受信装置19000は受信した参照フレームのインデックス情報により参照フレームの復号に使用されたコンテキスト情報(確率区間、コンテキストモデル又は確率モデル)を導き出す。受信装置19000は参照フレームのコンテキスト情報に基づいて現在フレームのポイントクラウドデータを復号する。
【0249】
図19に示すコンテキスト連続性処理部19001,19002は
図17のコンテキスト連続性処理部に対応する。
【0250】
本発明によるコンテキスト連続性処理部はポイントクラウドデータのフレームのコンテキスト連続性の適用有無を判断する。本発明によるポイントクラウドデータ受信装置19000は、参照フレームのインデックス情報又はフレームのコンテキスト連続性の適用有無に関する情報を含むビットストリームを受信する。コンテキスト連続性処理部は受信した情報に基づいて現在フレームに対するコンテキスト連続性の適用有無を判断する。コンテキスト連続性の適用有無は現在フレームと連関性のある参照フレームがあるか否かによって判断されてもよい。コンテキスト連続性処理部は参照フレームのインデックス情報がある場合、現在フレームに対してコンテキスト連続性が適用されたと判断する。現在フレームに対してコンテキスト連続性が適用された場合、受信装置19000は参照フレームのコンテキスト情報(確率区間、コンテキストモデル又は確率モデル)に基づいて現在フレームを復号する。またコンテキスト連続性処理部はフレームのコンテキスト情報を格納する。格納されたコンテキスト情報は受信装置19000で他のフレームを復号するときに使用される。
【0251】
図20は本発明によるポイントクラウドデータの符号化/復号過程の一例を示す。
図20を参照すると、ポイントクラウドデータの符号化/復号はコンテキスト連続性の適用有無を判断して20011、コンテキスト連続性の適用有無に基づいてポイントクラウドデータを符号化/復号する20013。そしてコンテキスト情報を格納する20014。
【0252】
コンテキスト連続性の適用有無の判断は現在フレームが従属Pフレーム(dependent P frame)(又は従属フレーム)であるか否かを確認する。if区文はrandom_access_period又はindependent P frameの有無を確認するが、フレームが2つの条件のいずれかに該当すると、フレームは従属Pフレームに該当しない。random_access_periodはIフレームを示し、Independent P frameはPフレームが他のフレームと連関性のない独立Pフレーム(又は独立フレーム)であることを示す。2つの条件のいずれに該当する場合、現在フレームは従属Pフレームではないので、以前のフレームに現在フレームと連関性がある参照フレームが存在しない。このとき、エントロピーコンテキストは初期化され(Initialize entropy context,20012)、初期化されたコンテキスト情報によって現在フレームが符号化又は復号される20013。エントロピーコンテキストの初期化はコンテキスト連続性を適用しないフレームの符号化又は復号を意味する。エントロピーコンテキストはコンテキストモデル、確率モデル又は確率区間を意味する。
【0253】
本発明による送信装置(
図16、
図18の送信装置など)の観点で、コンテキスト連続性の適用有無はフレーム間の連関性を判断して連関性のある参照フレームの有無によって判断される。現在フレームが従属Pフレームの場合、以前のフレームに連関性のある参照フレームが存在し、コンテキスト連続性が適用される。
【0254】
また本発明による受信装置(
図17、
図19の受信装置など)の観点で、コンテキスト連続性の適用有無は本発明による送信装置から生成/受信された情報に基づいて判断される。即ち、受信装置は受信されたコンテキスト連続性の適用有無に関する情報、参照フレームのインデックス情報などによって現在フレームのコンテキスト連続性の適用有無を判断する。
【0255】
フレームがrandom_access_period又はindependent P frameに該当しないと、現在フレームは従属Pフレームに該当する。従属Pフレームは以前のフレームに連関性のある参照フレームを有する。現在フレームが従属Pフレームであると、エントロピーコンテキストを初期化せず、現在フレームを符号化又は復号する20013。エントロピーコンテキストを初期化しないので、現在フレームは以前の参照フレームのコンテキストを連続して符号化又は復号される。即ち、現在フレームは参照フレームのコンテキスト情報に基づいて符号化又は復号される。
【0256】
次に、エントロピーコンテキスト確率が格納される(Saving entropy context probability)20014。エントロピーコンテキスト確率はコンテキスト情報を示す。コンテキスト情報はコンテキストモデル、確率モデル又は確率区間を示す。格納されたエントロピーコンテキスト確率は他のフレームの符号化又は復号時に使用される。
図20の符号化又は復号過程はフレームの数だけ繰り返されるので、全てのフレームに対して符号化又は復号が行われると、過程が終了する。
【0257】
図21は本発明によるポイントクラウドデータの符号化効率を示す。
図21を参照すると、本発明によるコンテキスト連続性を用いたポイントクラウドデータ符号化はC2-lossyのところで2.5%の利得(gain)を示す。
【0258】
図22は本発明によるポイントクラウドデータの符号化効率を示す。
図22を参照すると、本発明によるコンテキスト連続性を用いたポイントクラウドデータ符号化はCW-losslessのところで0.4%の利得(gain)を示す。
【0259】
一方、エントロピー連続スライス方法(entropy continuing slice method)は、TMC13[1]のイントラフレームコーディングの低遅延シナリオで使用される。この文書はエントロピーの連続による従属Pフレームを開示する。この方法はGroup of Frames(GoF)内でPフレームに対してエントロピー状態確率を続けることにより圧縮率を向上させる可能性を示す。
図21及び
図22に示したように、この方法の実験結果はInterEMv1.0の現在構造においてC2で2.5%、CWで0.4%の利得を示す。エントロピー連続スライス方法は本発明によるコンテキスト連続性を適用したフレームの符号化又は復号方法である。
【0260】
この文書ではフレーム間のコーディングのエントロピー連続方法について説明する。現在のInterEMv1.0はグローバル及びローカル動き検出(estimation)/補正(compensation)を支援する。モーションを調整した後、現在フレームの占有ビット(occupancy bits)は参照フレームにより予測され、エントロピー符号化によりコーディングされる。GoFの全てのPフレームはモーション適用参照フレーム(motion applied reference frame)にコーディングされるので、従属Pフレームの使用について紹介する。エントロピー連続はコンテキスト連続を示す。
【0261】
Cat3のイントラフレームコーディングは単一のスライスに該当する全てのフレームでエントロピー状態を初期化する。しかし、インターフレームコーディングで各フレームはグローバル/ローカルモーション及びインター占有予測に連結される。このような連結の属性を考慮して、以前のエントロピーを使用するP従属フレームが導入される。P従属フレームが導入された理由は次の通りである。
【0262】
1.Cat3フレームデータセットのほとんどは単一のフレームの単一のスライスで構成され、非常に希少なデータセットでは各フレームがいくつのポイントで構成される可能性がある。
【0263】
2.フレームレベルにおいて並列化よりも圧縮が優先する使用例。GoFで並列復号が使用され、GoF内でより多い連結が必要である。
【0264】
I及びPフレーム構造において、Pフレームの損失(losing)は次の参照フレームが表されるまで全てのフレームでの損失を誘発する。フレーム損失が不可避なランダムアクセスを支援する観点で、エントロピー状態の共有が可能であるか否かを条件としてP(従属/独立エントロピー状態)及びBフレームの検討(study)が提案される。
【0265】
並列復号(parallel decoding)はGoFレベル並列復号が支援される。しかし、現在の構造ではPフレームで並列復号の柔軟性がまだ支援されない。まずGoF構成する単位を定義する必要がある。そしてフレームレベル並列復号を考慮することについて論議する。従属Pフレームと独立Pフレームはそれぞれ圧縮及び並列化に対する利点がある。したがって、P従属フレームとP独立フレームを導入して圧縮と並列化の間の利点を取る方法が論議される。
【0266】
図23は本発明による符号化されたポイントクラウドデータの一例を示す。本発明によるポイントクラウドビデオエンコーダー10002は符号化20001の過程でポイントクラウドデータを符号化し、本発明による送信機10003は符号化されたポイントクラウドデータを含むビットストリームを本発明による受信装置10004に送信する。
【0267】
本発明による符号化されたポイントクラウドデータ(ビットストリーム)は、
図1のポイントクラウドビデオエンコーダー10002、
図2の符号化20001、
図4のエンコーダー、
図12の送信装置、
図14のXRデバイス1430、
図16及び
図18の送信装置及び/又は1つ以上のメモリと通信可能に設定された1つ以上のプロセッサ又は集積回路(integrated circuits)を含むハードウェア、ソフトウェア、ファームウェア又はこれらの組み合わせなどにより生成される。
【0268】
また本発明による符号化されたポイントクラウドデータ(ビットストリーム)は、
図1のポイントクラウドビデオデコーダー10006、
図2の復号20003、
図11のデコーダー、
図13の送信装置、
図14のXRデバイス1430、
図17及び
図19の受信装置及び/又は1つ以上のメモリと通信可能に設定された1つ以上のプロセッサ又は集積回路(integrated circuits)を含むハードウェア、ソフトウェア、ファームウェア又はこれらの組み合わせなどによって復号される。
【0269】
【0270】
SPS:シーケンスパラメータセット(Sequence Parameter Set)
【0271】
GPS:ジオメトリパラメータセット(Geometry Parameter Set)
【0272】
APS:特質パラメータセット(Attribute Parameter Set)
【0273】
TPS:タイルパラメータセット(Tile Parameter Set)
【0274】
Geom:ジオメトリビットストリーム(geometry bitstream)=ジオメトリスライスヘッダー(geometry slice header)+ジオメトリスライスデータ(geometry slice data)
【0275】
Attr:特質ビットストリーム(attribute bitstream)=特質ブリックヘッダー(attribute brick header)+特質ブリックデータ(attribute brick data)
【0276】
ポイントクラウドデータを領域ごとに分けて処理するためにタイル又はスライス領域が提供される。ポイントクラウドデータを各領域に分離するとき、各領域の重要度が異なる。したがって、重要度によって異なるフィルター又は異なるフィルターユニットを適用することにより、複雑度(complexity)は高いが結果の品質(quality)は良好なフィルタリング方法を重要領域に使用することができる。
【0277】
また受信装置の処理能力(capacity)によってポイントクラウドデータ全体に複雑なフィルタリング方法を使用する代わりに、領域ごとに(タイル又はスライスに分けられた領域)互いに異なるフィルタリングを適用することができる。したがって、重要領域に対して改善した画質とシステムで適切な遅延(latency)を保障することができる。即ち、ポイントクラウドデータは領域がタイルに分けられた場合、各タイルごとに異なるフィルター又は異なるフィルターユニットを適用することができる。またポイントクラウドデータは領域がスライスに分けられた場合は、各スライスごとに異なるフィルター又は異なるフィルターユニットを適用することができる。
【0278】
以下、本発明によるパラメータ(メタデータ、シグナリング情報など)は本発明による送信装置のプロセッサで生成され、本発明による受信装置に伝達される。例えば、本発明によるパラメータは本発明による送信装置のメタデータ処理部(又はメタデータ生成器)で生成され、本発明による受信装置のメタデータパーサから得られる。
【0279】
本発明によるポイントクラウドデータ送信装置(例えば、
図1、
図4、
図12、
図16及び
図18で説明したエンコーダー又は送信装置)は、ジオメトリ情報と特質情報のコンテキスト連続性の適用情報、現在フレームのインデックス情報及び参照フレームのインデックス情報を受信装置にシグナリングする。
【0280】
図24は本発明によるSequence Parameter SetのSyntaxの一例を示す。コンテキスト連続性構造情報はSPSに追加されてシグナリングされる。
【0281】
frameIdxは現在フレームがシーケンスにおいて何番目のフレームであるかをインデックスで示す。
【0282】
context_continue_flagはジオメトリ情報と特質情報の全てに対してコンテキスト連続性の適用有無を示す。Trueは現在フレームが以前のフレームのコンテキストを連続して使用することを示し(コンテキスト連続性が適用される)、falseは現在フレームが以前のフレームのコンテキストを連続して使用しないことを示す(コンテキスト連続性が適用されない)。
【0283】
context_continue_use_frameIdxは以前のフレームのうち、コンテキストの連続性が使用されたフレーム(参照フレーム)のインデックスを示す。参照フレームのインデックスは現在フレームからコンテキスト連続性が使用されたフレーム(参照フレーム)までの距離、最初のフレームから参照フレームまでの距離又は連続したPフレームのうち、参照フレームまでの順序などに基づいて示される。
【0284】
図25は本発明によるTile Parameter SetのSyntaxの一例を示す。コンテキスト連続性の構造情報はTPSに追加されてシグナリングする。
【0285】
tile_ctrは現在のタイルが全体タイルのうち、何番目のタイルであるかをインデックスで示す。
【0286】
tile_context_continue_flagはタイル単位のコンテキスト連続性の適用有無を示す。ジオメトリ情報と特質情報の全てに対してコンテキスト連続性の適用有無を示す。Trueは現在のタイルが以前のタイルでコンテキストを連続して使用することを示し、falseは現在のタイルが以前のタイルのコンテキストを連続して使用しないことを示す。
【0287】
tile_context_continue_use_tileIdxは以前のタイルのうち、コンテキスト連続性が使用されたタイル(参照タイル)のインデックスを示す。参照タイルのインデックスは現在のタイルから参照タイルまでの距離又は最初のタイルから参照タイルまでの距離に基づいてシグナリングされる。
【0288】
図26は本発明によるGeometry Parameter SetのSyntaxの一例を示す。コンテキスト連続性の構造情報はGPSに追加されてシグナリングされる。
【0289】
frameIdxは現在フレームがシーケンスにおいて何番目のフレームであるかをインデックスで示す。
【0290】
geometry_context_continue_flagはジオメトリ単位のコンテキスト連続性の適用有無を示す。Trueは現在フレームのジオメトリが以前のフレームのジオメトリのコンテキストを連続して使用することを示す。Falseは現在フレームのジオメトリが以前のフレームのジオメトリのコンテキストを連続して使用しないことを示す。
【0291】
geometry_context_continue_use_frameIdxは以前のフレームのうち、コンテキストの連続性が使用されたフレーム(参照フレーム)のインデックスを示す。参照フレームのインデックスは現在フレームから参照フレームまでの距離又は最初のフレームから参照フレームまでの距離に基づいてシグナリングされる。
【0292】
図27は本発明によるAttribute Parameter SetのSyntaxの一例を示す。コンテキスト連続性の構造情報はAPSに追加してシグナリングされる。
【0293】
frameIdxは現在フレームがシーケンスにおいて何番目のフレームであるかをインデックスで示す。
【0294】
attribute_context_continue_flagは特質単位のコンテキスト連続性の適用有無を示す。Trueは現在フレームの特質が以前のフレームの特質のコンテキストを連続して使用することを示し、falseは現在フレームの特質に対して以前のフレームの特質のコンテキストを連続して使用しないことを示す。
【0295】
attribute_context_continue_use_frameIdxは以前のフレームのうち、コンテキストの連続性が使用されたフレーム(参照フレーム)のインデックスを示す。参照フレームのインデックスは現在フレームから参照フレームまでの距離又は最初のフレームから参照フレームまでの距離に基づいてシグナリングされる。
【0296】
図28は本発明によるジオメトリビットストリームのスライスヘッダーのSyntaxの一例を示す。コンテキスト連続性の構造情報はGeomのスライスヘッダーに追加してシグナリングされる。
【0297】
gsh_slice_idは現在のスライスが何番目のスライスであるかというスライスインデックスを示す。
【0298】
geometry_slice_context_continue_flagはジオメトリスライス単位のコンテキスト連続性の適用有無を示す。Trueは現在のスライスが以前のスライスのコンテキストを連続して使用することを示し、falseは現在のスライスが以前のスライスのコンテキストを連続して使用しないことを示す。
【0299】
geometry_slice_context_continue_use_frameIdxは以前のスライスのうち、コンテキストの連続性が使用されたスライス(参照スライス)のインデックスを示す。参照スライスのインデックスは現在のスライスから参照スライスまでの距離又は最初のスライスから参照スライスまでの距離に基づいてシグナリングされる。
【0300】
図29は本発明によるポイントクラウドデータ送信方法の一例を示す。ポイントクラウドデータ送信方法は、ポイントクラウドデータを符号化する段階(S2900)、及びポイントクラウドデータを含むビットストリームを送信する段階(S2910)を含む。またポイントクラウドデータを符号化する段階(S2900)は、ポイントクラウドデータのジオメトリデータを符号化する段階と、ポイントクラウドデータの特質情報を符号化する段階を含む。
【0301】
ポイントクラウドデータを符号化する段階(S2900)は、
図1のポイントクラウドビデオエンコーダー10002、
図2の符号化20001、
図4のエンコーダー、
図12の送信装置、
図14のXRデバイス1430、
図16又は
図18の送信装置及び/又は1つ以上のメモリと通信可能に設定された1つ以上のプロセッサ又は集積回路(integrated circuits)を含むハードウェア、ソフトウェア、ファームウェア又はこれらの組み合わせなどによってポイントクラウドデータを符号化する。
【0302】
ポイントクラウドデータを含むビットストリームを送信する段階(S2910)は、
図1の送信機10003、
図12の送信処理部12012、
図14のXRデバイス1430、
図16又は
図18の送信装置及び/又は1つ以上のメモリと通信可能に設定された1つ以上のプロセッサ又は集積回路(integrated circuits)を含むハードウェア、ソフトウェア、ファームウェア又はこれらの組み合わせなどによってポイントクラウドデータを送信する。
【0303】
ポイントクラウドデータを符号化する段階(S2900)では、現在フレームのポイントクラウドデータのコンテキスト連続性の適用有無を判断して、コンテキスト連続性の適用有無に対応して現在フレームを符号化し、現在フレームのコンテキストを格納する。
【0304】
フレームのコンテキスト連続性の適用有無の判断は、フレーム間の連関性によって以前のフレームから参照フレームを探索することができる。このとき、フレーム間の連関性の探索はフレームのタイプ(例えば、Iフレーム又はPフレームなど)に基づいて行われる。またフレーム間の連関性の判断はフレーム間の動きベクトルの差に基づいて行われてもよく、フレーム間の連関性の判断はフレーム間のジオメトリ情報又は特質情報のRDO値に基づいて行われてもよい。フレーム間の連関性の判断(又は探索)は、
図16のコンテキスト連続性の判別及び格納部、
図18のコンテキスト連続性の判別及び格納部で行われる。フレーム間の連関性の判断については
図16及び
図18で説明したので詳しい内容は省略する。以前のフレームで現在フレームと連関性のある参照フレームがあれば、現在フレームのポイントクラウドデータにコンテキスト連続性を適用して符号化すると判断することができる。
【0305】
コンテキスト連続性の適用有無によるフレーム符号化(コード化)は、以前のフレームにおいて現在フレームと連関性のある参照フレームが存在する場合は、現在フレームの符号化時、参照フレームのコンテキスト情報(確率区間、コンテキストモデル又は確率モデル)を連続して利用する。現在フレームは参照フレームの算術符号化により導き出された確率区間に連続して符号化されるか、或いは参照フレームの算術符号化時に使用されたコンテキストモデル又は確率モデルを使用して符号化される。即ち、現在フレームは参照フレームのコンテキスト情報に基づいて符号化され、コンテキスト連続性が適用される。
【0306】
フレームのコンテキスト格納は現在フレームの符号化時に導き出されるコンテキスト情報(確率区間、コンテキストモデル又は確率モデル)を格納する。格納されたコンテキスト情報は他のフレームの符号化過程で使用される。
【0307】
本発明によるフレームはIフレームとPフレームのいずれかを含む。Iフレームは複数のフレームの集合であるGoF(Group of Frames)の最初のフレームに該当し、PフレームはIフレーム又は他のPフレームを参照して予測されたフレームである。本発明によるフレームは連関性判断によって参照フレームがあってもなくてもよい。現在フレームは参照フレームがあれば、従属フレームとしてコンテキスト連続性が適用され、参照フレームがなければ、独立(非依存)フレームとしてコンテキスト連続性が適用されず符号化される。
【0308】
ポイントクラウドデータを含むビットストリームを送信する段階(S2910)において、ビットストリームは参照フレームを示すインデックス情報を含む。ビットストリームは現在フレームのインデックス情報、コンテキスト連続性の適用有無に関する情報をさらに含む。参照フレームを示すインデックス情報はGoF(Group of Frames)内の最初のフレームから参照フレームまでの距離に基づく。又は参照フレームを示すインデックス情報は現在フレームからの距離に基づく。参照フレームを示すインデックス情報は現在フレームの直前のフレームを示す。コンテキスト連続性の適用有無に関する情報は現在フレームが参照フレームのコンテキストに基づいて符号化されるか否かを示す。
【0309】
フレームのコンテキスト連続性の適用有無を判断、フレームと連関性のある参照フレームの有無に対応して参照フレームのコンテキストに基づくフレーム符号化及びフレームのコンテキスト格納は、
図16又は
図18で説明したポイントクラウドデータ送信装置、コンテキスト連続性の判別及び格納部又はArithmeticコーダで行われる。現在フレーム又は参照フレームのインデックス情報とコンテキスト連続性の適用有無に関する情報及びコンテキスト情報の生成及び伝達は、
図16又は
図18で説明したコンテキスト連続性の判別及び格納部で行われる。
【0310】
図30は本発明によるポイントクラウドデータ受信方法の一例を示す。
【0311】
本発明によるポイントクラウドデータ受信方法は、ポイントクラウドデータを含むビットストリームを受信する段階(S3000)、ポイントクラウドデータを復号する段階(S3010)及び/又はポイントクラウドデータをレンダリングする段階を含む。ポイントクラウドデータを復号する段階(S3010)は、ポイントクラウドデータのジオメトリ情報を復号(decoding)する段階と、ポイントクラウドデータの特質情報を復号(decoding)する段階を含む。
【0312】
ポイントクラウドデータを含むビットストリームを受信する段階(S3000)において、ビットストリームは参照フレームを示すインデックス情報を含む。ビットストリームは現在フレームのインデックス情報、コンテキスト連続性の適用有無に関する情報をさらに含む。参照フレームを示すインデックス情報はGoF(Group of Frames)内の最初のフレームから参照フレームまでの距離に基づいて指定される。又は参照フレームを示すインデックス情報は現在フレームから参照フレームまでの距離に基づいて指定される。なお、参照フレームを示すインデックス情報は現在フレームの直前のフレームを示す。
【0313】
ポイントクラウドデータを復号する段階(S3010)では、ポイントクラウドデータのフレームのコンテキスト連続性の適用有無を判断し、コンテキスト連続性の適用有無に対応してフレームと連関性のある参照フレームのコンテキストに基づいてフレームを復号する。またポイントクラウドデータを復号する段階(S3010)では復号されたフレームのコンテキストを格納する。
【0314】
フレームのコンテキスト連続性の適用有無はコンテキスト連続性の適用有無情報又は現在フレームと連関性のある参照フレームの有無に基づいて判断される。参照フレームの連関性はフレームのタイプに基づいて判断される。フレームのタイプはIフレーム、Pフレーム及びBフレームのいずれかを示す。連関性は現在フレームと以前のフレームのタイプに基づいてフレーム間の連関性が判断される。また連関性はフレーム間の動きベクトル差に基づいて判断されるか、又はフレーム間のジオメトリ情報又は特質情報のRDO値に基づいて判断される。フレーム間の連関性の判断については
図16で説明したので重複する内容は省略する。
【0315】
本発明によるフレームはIフレームとPフレームのいずれかを含む。Iフレームは複数のフレームの集合であるGoF(Group of Frames)の最初のフレームに該当し、PフレームはIフレーム又は他のPフレームを参照して予測されたフレームである。本発明によるフレームは連関性判断によって参照フレームがあってもなくてもよい。現在フレームが参照フレームがあれば、従属フレームとしてコンテキスト連続性が適用され、参照フレームがなければ、独立(非依存)フレームとしてコンテキスト連続性が適用されず、復号される。
【0316】
現在フレームと連関性のある参照フレームはビットストリームに含まれた参照フレームのインデックス情報から分かる。またコンテキスト連続性の適用有無を示す情報により現在フレームに対するコンテキスト連続性の適用有無を判断することができる。コンテキスト連続性が適用されるか、又は参照フレームのインデックスがある場合、本発明による受信装置は現在フレームと連関性のある参照フレームがあることが分かる。
【0317】
コンテキスト連続性の適用有無に対応して参照フレームのコンテキストに基づいてフレームを復号する段階では、以前のフレームに参照フレームがある場合、参照フレームのコンテキストを用いて現在フレームを復号する。参照フレームのコンテキストは確率区間、コンテキストモデル及び確率モデルのいずれかを含む。参照フレームのコンテキスト情報は
図17又は
図19で説明したコンテキスト連続性処理部に格納される。
【0318】
参照フレームが存在する場合、現在フレームが参照フレームのコンテキストを連続して符号化されたことを意味する。したがって、本発明による受信装置は、参照フレームのコンテキスト情報に基づいて現在フレームを復号する。また本発明による受信装置は現在フレームのコンテキスト情報を格納する。格納されたコンテキスト情報は他のフレームを復号するときに使用することができる。
【0319】
本発明によるポイントクラウドデータ送信装置/受信装置、本発明によるポイントクラウド送信方法/受信方法、及びシグナリング方法は、以下の効果を提供する。
【0320】
本発明は連関性の高いフレーム間のコンテキスト情報を用いて重複情報をできる限り除去することにより、ビットストリームを効率的に構成することができる。したがって、ジオメトリ情報と特質情報の圧縮効率を向上させることができる。ジオメトリと特質のそれぞれの適用範囲をシグナリングすることにより、最適の圧縮効率を達成し、符号化/復号時の全てのフレームに初期化された確率モデルを使用することではないので、メモリ減少効果及びコンピューティング時間節減の効果が得られる。
【0321】
本発明によるポイントクラウドデータはライダー(LiDAR)装備でキャプチャーされ、角度モード(angular mode)を適用できるようにスライドに分割する方法を支援することにより、1つのコンテンツに統合された3Dマップデータの効率的なジオメトリ圧縮が可能である。
【0322】
本発明によるポイントクラウドデータフレームを1つのポイントクラウドコンテンツに統合したとき、Geometry-based Point Cloud Compression(G-PCC)の効率的なジオメトリ圧縮のためにスライドに分割する方法を提供することにより、ジオメトリ圧縮コーディング/復号の効率性を増加させることができる。
【0323】
本発明によるポイントクラウドデータ送受信方法/装置は、ライダー(LiDAR)装備でキャプチャーされたポイントクラウドデータを3Dマップに基づいて分割する動作及び関連シグナリング情報に基づいてポイントクラウドデータをより効率的に圧縮して復元することができる。
【0324】
本発明は方法及び/又は装置の観点で説明しており、方法の説明及び装置の説明は互いに補完して適用できる。
【0325】
説明の便宜のために各図を区分して説明したが、各図に述べている本発明を併合して新しい本発明を具現するように設計することも可能である。また通常の技術者の必要によって、以前に説明した本発明を実行するためのプログラムが記録されているコンピューターで読み取り可能な記録媒体を設計することも本発明の権利範囲に属する。本発明による装置及び方法は、上述したように、説明された本発明の構成と方法が限定して適用されることではなく、本発明は様々に変形可能に各本発明の全部又は一部が選択的に組み合わせられて構成されることもできる。本発明の好ましい本発明について示して説明したが、本発明は上述した特定の本発明に限定されず、請求の範囲で請求する本発明の要旨から離脱せず、当該発明が属する技術分野において通常の知識を有する者により様々な変形実施が可能であり、かかる変形実施は本発明の技術的思想や見込みから個々に理解されてはいけない。
【0326】
本発明による装置の様々な構成要素は、ハードウェア、ソフトウェア、ファームウェア又はそれらの組み合わせにより構成される。本発明の様々な構成要素は一つのチップ、例えば、一つのハードウェア回路で具現される。本発明において、本発明による構成要素はそれぞれ個々のチップで具現される。本発明において、本発明による装置の構成要素のいずれかは一つ又はそれ以上のプログラムを実行できる一つ又はそれ以上のプロセッサで構成され、一つ又はそれ以上のプログラムは本発明による動作/方法のうちのいずれか一つ又はそれ以上の動作/方法を行わせるか、実行させるための指示を含む。
【0327】
本発明による装置の方法/動作を行うための実行可能な指示は、一つ又はそれ以上のプロセッサにより実行されるために構成された一時的ではないCRM又は他のコンピュータープログラム製品に格納されるか、又は一つ又はそれ以上のプロセッサにより実行されるために構成された一時的なCRM又は他のコンピュータープログラム製品に格納されることができる。
【0328】
また本発明によるメモリは、揮発性メモリ(例えば、RAMなど)だけではなく、非揮発性メモリ、フラッシュメモリ、PROMなどを全部含む概念として使用される。また、インターネットによる送信などのような搬送波の形態で具現されることも含む。またプロセッサが読み取られる記録媒体は、ネットワークで連結されたコンピューターシステムに分散されて、分散方式によりプロセッサが読み取られるコードが格納されて実行されることができる。
【0329】
この明細書において、"/"と","は"及び/又は"に解釈される。例えば、"A/B"は"A及び/又はB"に解釈され、"A、B"は"A及び/又はB"に解釈される。さらに、"A/B/C"は"A、B及び/又はCのうちのいずれか"を意味する。また、"A、B、C"も"A、B及び/又はCのうちのいずれか"を意味する。さらに、この文書において、"又は"は"及び/又は"に解釈される。例えば、"A又はB"は、1)"A"のみを意味するか、2)"B"のみを意味するか、又は3)"A及びB"を意味する。言い換えれば、この明細書において"又は"は"さらに(additionally)又は代わりに(alternatively)"を意味する。
【0330】
第1、第2などの用語は本発明の様々な構成要素を説明するために使用される。しかし、本発明による様々な構成要素は上記用語により解釈が制限されてはいけない。かかる用語は一つの構成要素を他の構成要素と区別するために使用されることに過ぎない。例えば、第1ユーザ入力信号は第2ユーザ入力信号と称することができる。同様に、第2ユーザ入力信号は第1ユーザ入力信号と称することができる。かかる用語の使用は様々な本発明の範囲から離脱していない。第1ユーザ入力信号及び第2ユーザ入力信号はいずれもユーザ入力信号であるが、文脈上、明確に示していない限り、同一のユーザ入力信号を意味してはいない。
【0331】
本発明を説明のために使用された用語は、特定の本発明を説明するために使用されており、本発明を制限されるものではない。本発明の説明及び請求範囲で使用したように、文脈上明確に称していない限り、単数は複数を含む。「及び/又は」表現は用語間の全ての可能な結合を含む意味で使用される。「含む」は特徴、数、段階、要素及び/又はコンポーネントが存在することを説明し、さらなる特徴、数、段階、要素及び/又はコンポーネントを含まないことを意味しない。本発明を説明するために使用される、「~である場合」、「~の時」などの条件表現は選択的な場合にのみ制限して解釈されない。特定の条件を満たすとき、特定の条件に対応して関連動作を行うか、又は関連定義が解釈されるように意図されている。
【0332】
また、この明細で説明する本発明による動作は、本発明によってメモリ及び/又はプロセッサを含む送受信装置により行われる。メモリは本発明による動作を処理/制御するためのプログラムを格納し、プロセッサはこの明細で説明した様々な動作を制御する。プロセッサはコントローラなどとも称される。本発明の動作はファームウェア、ソフトウェア及び/又はこれらの組み合わせにより行われ、ファームウェア、ソフトウェア及び/又はこれらの組み合わせはプロセッサに格納されるか又はメモリに格納される。
【0333】
一方、上述した本発明による動作は、本発明による送信装置及び/又は受信装置により行われる。送受信装置はメディアデータを送受信する送受信部、本発明によるプロセスに対する指示(プログラムコード、アルゴリズム、フローチャート及び/又はデータ)を格納するメモリ、及び送受信装置の動作を制御するプロセッサを含む。
【0334】
プロセッサはコントローラなどとも称され、例えば、ハードウェア、ソフトウェア及び/又はそれらの組み合わせに対応する。上述した本発明による動作はプロセッサにより行われる。またプロセッサは上述した本発明の動作のためのエンコーダー/デコーダーなどで具現される。
【0335】
〔発明の実施のための形態〕
上述したように、本発明を実施するための最善の形態について関連内容を説明する。
【0336】
〔産業上の利用可能性〕
上述したように、本発明はポイントクラウドデータ送受信装置及びシステムに全体又は部分的に適用することができる。当業者であれば、本発明の範囲内で本発明を様々に変更及び変形することができる。本発明は変更/変形を含み、変更/変形は請求項及びそれと同一のものの範囲内である。
【手続補正書】
【提出日】2023-12-18
【手続補正1】
【補正対象書類名】特許請求の範囲
【補正対象項目名】全文
【補正方法】変更
【補正の内容】
【特許請求の範囲】
【請求項1】
ポイントクラウドデータ送信方法であって、
フレームに含まれたポイントクラウドデータを符号化する段階;及び
前記ポイントクラウドデータを含むビットストリームを送信する段階;を含んでなり、
前記ポイントクラウドデータを符号化する段階は、
前記ポイントクラウドデータのジオメトリ情報を符号化する段階と、
前記ポイントクラウドデータの特質情報を符号化する段階と、を含む、ポイントクラウドデータ送信方法。
【請求項2】
前記フレームに含まれた前記ポイントクラウドデータは以前のフレームに基づいて符号化さ
れ、
前記フレームは前記以前のフレームに連関する従属フレームであり、
前記フレームに含まれた前記ポイントクラウドデータは前記以前のフレームのコンテキストに基づいて符号化され、
前記ポイントクラウドデータを符号化する段階は、前記フレームのコンテキストを格納する段階を含む、請求項1に記載のポイントクラウドデータ送信方法。
【請求項3】
前記フレームに連関する前記以前のフレームは参照フレームであり、
前記参照フレームは前記以前のフレームのタイプに基づいて探索される、請求項
2に記載のポイントクラウドデータ送信方法。
【請求項4】
前記ビットストリームは前記参照フレームを示すインデックス情報を含み、
前記ビットストリームは前記フレームが前記参照フレームのコンテキストに基づいて符号化されるか否かを示す情報を含
み、
前記インデックス情報は最初のフレームから前記参照フレームまでの距離に基づく、請求項
3に記載のポイントクラウドデータ送信方法。
【請求項5】
前記フレームはIフレーム及びPフレームの何れかを含み、
前記Iフレームは複数のフレームの集合であるGoF(Group of Frames)の最初のフレームであり、
前記Pフレームは前記Iフレーム又は他のPフレームを参照して予測されたフレームである、請求項1に記載のポイントクラウドデータ送信方法。
【請求項6】
前記参照フレームはフレームの間の動きベクトルの差に基づいて探索される、請求項
3に記載のポイントクラウドデータ送信方法。
【請求項7】
ポイントクラウドデータ送信装置であって、
フレームに含まれたポイントクラウドデータを符号化するエンコーダー;及び
前記ポイントクラウドデータを含むビットストリームを送信する送信機;を備えてなり、
前記エンコーダーは、前記ポイントクラウドデータのジオメトリ情報及び前記ポイントクラウドデータの特質情報を符号化する、ポイントクラウドデータ送信装置。
【請求項8】
前記フレームに含まれた前記ポイントクラウドデータは以前のフレームに基づいて符号化さ
れ、
前記フレームは前記以前のフレームに連関する従属フレームであり、
前記フレームに含まれた前記ポイントクラウドデータは前記以前のフレームのコンテキストに基づいて符号化され、
前記エンコーダーは前記フレームのコンテキストを格納する、請求項
7に記載のポイントクラウドデータ送信装置。
【請求項9】
前記フレームに連関する前記以前のフレームは参照フレームであり、
前記参照フレームは前記以前のフレームのタイプに基づいて探索さ
れ、
前記ビットストリームは前記参照フレームを示すインデックス情報を含み、
前記ビットストリームは前記フレームが前記参照フレームのコンテキストに基づいて符号化されるか否かを示す情報を含む、請求項
7に記載のポイントクラウドデータ送信装置。
【請求項10】
ポイントクラウドデータ受信方法であって、
フレームに含まれたポイントクラウドデータを含むビットストリームを受信する段階;及び
前記ポイントクラウドデータを復号する段階;を含んでなり、
前記ポイントクラウドデータを復号する段階は、
前記ポイントクラウドデータのジオメトリ情報を復号する段階と、
前記ポイントクラウドデータの特質情報を復号する段階と、を含む、ポイントクラウドデータ受信方法。
【請求項11】
前記フレームの前記ポイントクラウドデータは以前のフレームに基づいて復号さ
れ、
前記フレームは前記以前のフレームに連関する従属フレームであり、
前記フレームの前記ポイントクラウドデータは前記以前のフレームのコンテキストに基づいて復号され、
前記ポイントクラウドデータを復号する段階は前記フレームのコンテキストを格納する段階を含む、請求項
10に記載のポイントクラウドデータ受信方法。
【請求項12】
前記フレームに連関する前記以前のフレームは参照フレームであり、
前記参照フレームは前記以前のフレームのタイプに基づいて探索さ
れ、
前記ビットストリームは前記参照フレームを示すインデックス情報を含み、
前記ビットストリームは前記フレームが前記参照フレームのコンテキストに基づいて符号化されるか否かを示す情報を含む、請求項
11に記載のポイントクラウドデータ受信方法。
【請求項13】
ポイントクラウドデータ受信装置であって、
フレームに含まれたポイントクラウドデータを含むビットストリームを受信する受信部;及び
前記ポイントクラウドデータを復号するデコーダー;を備えてなり、
前記デコーダーは前記ポイントクラウドデータのジオメトリ情報及び特質情報を復号し、
前記フレームに含まれた前記ポイントクラウドデータは以前のフレームに基づいて復号される、ポイントクラウドデータ受信装置。
【請求項14】
前記フレームは前記以前のフレームに連関する従属フレームであ
り、
前記フレームの前記ポイントクラウドデータは前記以前のフレームのコンテキストに基づいて復号され、
前記デコーダーは前記フレームのコンテキストを格納し、
前記フレームに連関する前記以前のフレームは参照フレームであり、
前記参照フレームは前記以前のフレームのタイプに基づいて探索される、請求項
13に記載のポイントクラウドデータ受信装置。
【請求項15】
前記ビットストリームは前記参照フレームを示すインデックス情報を含み、
前記ビットストリームは前記フレームが前記参照フレームのコンテキストに基づいて符号化されるか否かを示す情報を含む、請求項
14に記載のポイントクラウドデータ受信装置。
【国際調査報告】