(19)【発行国】日本国特許庁(JP)
(12)【公報種別】特許公報(B2)
(11)【特許番号】
(24)【登録日】2023-07-07
(45)【発行日】2023-07-18
(54)【発明の名称】点群を符号化し再構築するための方法及び装置
(51)【国際特許分類】
H04N 19/60 20140101AFI20230710BHJP
H04N 19/597 20140101ALI20230710BHJP
H04N 19/90 20140101ALI20230710BHJP
【FI】
H04N19/60
H04N19/597
H04N19/90
(21)【出願番号】P 2019561153
(86)(22)【出願日】2018-04-12
(86)【国際出願番号】 EP2018059420
(87)【国際公開番号】W WO2018215134
(87)【国際公開日】2018-11-29
【審査請求日】2021-04-08
(32)【優先日】2017-05-24
(33)【優先権主張国・地域又は機関】EP
(73)【特許権者】
【識別番号】518338149
【氏名又は名称】インターデジタル ヴイシー ホールディングス, インコーポレイテッド
(74)【代理人】
【識別番号】100079108
【氏名又は名称】稲葉 良幸
(74)【代理人】
【識別番号】100109346
【氏名又は名称】大貫 敏史
(74)【代理人】
【識別番号】100117189
【氏名又は名称】江口 昭彦
(74)【代理人】
【識別番号】100134120
【氏名又は名称】内藤 和彦
(74)【代理人】
【識別番号】100108213
【氏名又は名称】阿部 豊隆
(72)【発明者】
【氏名】ツァイ,カンイン
(72)【発明者】
【氏名】フー,ウェイ
(72)【発明者】
【氏名】ラセール,セバスチャン
【審査官】間宮 嘉誉
(56)【参考文献】
【文献】特開2000-113224(JP,A)
【文献】特開2017-227975(JP,A)
【文献】特開2017-126890(JP,A)
【文献】国際公開第2017/104115(WO,A1)
【文献】米国特許出願公開第2018/0278956(US,A1)
【文献】MERKLE, Philipp et al.,MVC: Experiments on Coding of Multi-View Video Plus Depth,JVT-X064,ITU,2007年06月26日,pp.1-12,JVT-X064.doc
【文献】THANOU, Dorina et al.,Graph-Based Compression of Dynamic 3D Point Cloud Sequences,IEEE Transactions on Image Processing,IEEE,2016年02月11日,Vol.25, No.4,pp.1765-1778,[online],Retrieved from the Internet: <URL: https://ieeexplore.ieee.org/document/7405340>
【文献】THANOU, Dorina et al.,Graph-Based Motion Estimation and Compensation for Dynamic 3D Point Cloud Compression,Proc. IEEE International Conference on Image Processing 2015,カナダ,IEEE,2015年09月27日,pp.3235-3239,[online],Retrieved from the Internet: <URL: https://ieeexplore.ieee.org/document/7351401>
(58)【調査した分野】(Int.Cl.,DB名)
G06T 1/00- 1/40
G06T 3/00- 5/50
G06T 11/00-11/60
G06T 13/00-19/20
H04N 7/12
H04N 19/00-19/98
IEEE Xplore
SPIE Digital Library
(57)【特許請求の範囲】
【請求項1】
3D空間内の点の空間位置及び前記点の少なくとも1つの特徴に基づいて複数の点を含む点群を点の複数のクラスタへと区分化すること、
点の各クラスタのグラフに基づく表現を得ることであって、前記グラフに基づく表現は複数の頂点及び2つの頂点を接続する少なくとも1つの辺を有し、辺にはクラスタの2つの隣接点の複数の属性の類似度を捕捉する重みが割り当てられること、
少なくとも1つの前記重みに基づいて変換係数を符号化すること
を含む、方法。
【請求項2】
少なくとも1つのクラスタについて、前記符号化済みの変換係数及び前記クラスタの識別情報を伝送することを更に含む、請求項1に記載の方法。
【請求項3】
重みが閾値を下回る場合は前記重みを0に設定し、対応する頂点の接続を解除する、請求項1に記載の方法。
【請求項4】
前記変換係数がグラフフーリエ変換の係数である、請求項1に記載の方法。
【請求項5】
前記少なくとも1つの特徴が色情報を含む、請求項1に記載の方法。
【請求項6】
2つの頂点Pi及びPjを接続する辺の重みが
【数1】
によって定められる重みwi,jであり、gi及びgjは点Pi及びPjの空間位置及び別の特徴をそれぞれ表すベクトルであり、σは前記重みの値を制御するために使用されるパラメータである、請求項1に記載の方法。
【請求項7】
3D空間内の点の空間位置及び前記点の少なくとも1つの特徴に基づいて複数の点を含む点群を点の複数のクラスタへと区分化するように構成される区分化モジュールと、
点の各クラスタのグラフに基づく表現を得るように構成される構築モジュールであって、前記グラフに基づく表現は複数の頂点及び2つの頂点を接続する少なくとも1つの辺を有し、辺にはクラスタの2つの隣接点の複数の属性の類似度を捕捉する重みが割り当てられる、構築モジュールと、
少なくとも1つの前記重みに基づいて変換係数を符号化するように構成される符号化モジュールと
を含む、装置。
【請求項8】
少なくとも1つのクラスタについて、前記符号化済みの変換係数及び前記クラスタの識別情報を伝送するように構成されるインタフェースを含む、請求項7に記載の装置。
【請求項9】
重みが閾値を下回る場合は前記重みを0に設定し、対応する頂点の接続を解除する、請求項7に記載の装置。
【請求項10】
前記変換係数がグラフフーリエ変換の係数である、請求項7に記載の装置。
【請求項11】
前記少なくとも1つの特徴が色情報を含む、請求項7に記載の装置。
【請求項12】
2つの頂点Pi及びPjを接続する辺の重みが
【数2】
によって定められる重みwi,jであり、gi及びgjは点Pi及びPjの空間位置及び別の特徴をそれぞれ表すベクトルであり、σは前記重みの値を制御するために使用されるパラメータである、請求項7に記載の装置。
【請求項13】
点のクラスタに関連する変換係数及び点群の点の複数のクラスタの識別情報を含むデータを受信すること、
点の各クラスタに関連する前記受信した変換係数を復号すること、及び
前記復号した変換係数及び点のクラスタの識別情報から、前記クラスタの点の3D空間内の空間位置及び前記点の少なくとも1つの特徴を再構築すること
を含む、方法。
【請求項14】
前記変換
係数がグラフフーリエ変換
の係数である、請求項13に記載の方法。
【請求項15】
前記少なくとも1つの特徴が色情報を含む、請求項13に記載の方法。
【請求項16】
点群を再構築するための装置であって、
点のクラスタに関連する変換係数及び点群の点の複数のクラスタの識別情報を含むデータを受信するように構成される受信機と、
点の各クラスタに関連する前記受信された変換係数を復号するように構成される復号モジュールと、
前記復号された変換係数及び点のクラスタの識別情報から、前記クラスタの点の3D空間内の空間位置及び前記点の少なくとも1つの特徴を再構築するように構成される再構築モジュールと
を含む、装置。
【請求項17】
前記変換
係数がグラフフーリエ変換
の係数である、請求項16に記載の装置。
【請求項18】
前記少なくとも1つの特徴が色情報を含む、請求項16に記載の装置。
【請求項19】
請求項1~6の何れか一項に記載の方法をコンピュータが実行できるようにするためのコンピュータ実行可能命令を含む、コンピュータ可読プログラム。
【請求項20】
請求項13~15の何れか一項に記載の方法をコンピュータが実行できるようにするためのコンピュータ実行可能命令を含む、コンピュータ可読プログラム。
【請求項21】
請求項19に記載のコンピュータ可読プログラムを含む、非一時的コンピュータ可読媒体。
【請求項22】
請求項20に記載のコンピュータ可読プログラムを含む、非一時的コンピュータ可読媒体。
【発明の詳細な説明】
【技術分野】
【0001】
発明の分野
本開示は、一般に点群データ源の分野に関する。より詳細には、本発明は点群圧縮(PCC)を扱う。従って、本開示は点群を符号化するための方法及び対応する符号器に関する。本開示は、点群を再構築するための方法及び対応する復号器にも関する。本開示は、本発明の符号化方法及び再構築方法を実装するコンピュータプログラムに更に関する。
【背景技術】
【0002】
発明の背景
この節に記載する手法は遂行可能だが、過去に考案され又は遂行されている手法では必ずしもない。従って本明細書で別段の定めがない限り、この節に記載の手法は本願の特許請求の範囲に対する従来技術ではなく、この節に含まれることによって従来技術として認めることもない。
【0003】
点群は1組の点で構成される。各点はその空間位置(x,y,z)、即ち幾何学的配置情報、及び(R,G,B)又は(Y,U,V)又は他の任意の色座標系内の色情報を概して含む様々な属性によって定められる。幾何学的配置は属性データの1つと見なすことができる。本開示の残りの部分では、幾何学的配置データ及び他の属性データの両方を点の属性と見なす。
【0004】
点群データ源は多くの応用において見つかる。大規模な点群データ源に依拠する重要な応用は地理情報システム、ロボット工学、医療断層撮影、及び科学的可視化において見つけることができる。
【0005】
より工業的であり且つ科学指向であるこれらの応用の他に、飛行時間又は他の奥行検知技術に基づく安価な3Dスキャナの人気の高まり、モバイル装置上での3D捕捉、及びクラウドベースの3D印刷の台頭が、大規模な相互運用可能な圧縮3D点群の記憶及び伝送データ形式の大きい需要を消費者市場内で作り出している。
【0006】
走査される3D点群はしばしば何千もの点を有し、大量の記憶空間を占有する。加えて、それらの点群は3Dスキャナからライブで捕捉されるとき高速で生成することができ、データ転送速度を一層高める。従って、点群圧縮はネットワーク化された効率的な配信及び記憶に不可欠である。
【0007】
3Dグラフィックス及びロボット工学の分野で点群圧縮のかなりの取り組みがなされてきたが、それらの取り組みは効率的な相互運用可能且つ完全な終端間3Dマルチメディアシステムを構築するための要件の一部に概して対処しない。
【0008】
例えば高品質レンダリングに重要な色及び他の属性値の符号化はしばしば無視され、又は例えば色の単純な単方向の予測符号化を行うことによって非効率的に処理される。更に、経時変化する点群、即ち或る期間にわたって高速で捕捉される一連の群の圧縮は限られている。更に、ハードウェア/帯域幅限界が該当するシステム又は低遅延が極めて重要であるシステムでは、複雑度が低く非可逆的な符号化を伴う方法が興味を引く。これらの課題に対処するために点群圧縮の研究を引き続き行う必要がある。
【0009】
従来技術では、点群の様々な符号化方法が提案されてきた。
【0010】
第1の符号化手法は8分木に基づく点群表現に基づく。これは例えばJ. Peng及びC.-C. Jay Kuo, “Geometry-guided progressive lossless 3D mesh coding with octree (OT) decomposition,” ACM Trans. Graph, vol. 21, no. 2, pp. 609-616, July 2005、並びにYan Huang, Jingliang Peng, C.-C. Jay Kuo及びM. Gopi, “A Generic Scheme for Progressive Point Cloud Coding,” IEEE Transactions on Visualization and Computer Graphics, vol.14, no.2, pp.440-453, 2008の中で記載されている。
【0011】
8分木とは、全ての分岐ノードが空間内の特定の立方体の又は立方形の境界ボリュームを表すツリーデータ構造である。根から始まり、全ての分岐はノードの境界ボックスのサブオクタントごとに1つの最大8個の子を有する。
【0012】
【0013】
圧縮のために、単一のビットを使用して分岐ノードの全ての子が空かどうかを印付けし、8個のオクタントの幾らかの一貫した順序付けを仮定し、その分岐ノード構成は単一のバイトによって効率的に表すことができる。木を幅優先順に横断し、遭遇する全ての子ノード構成バイトを出力することによって空間内の点分布を効率的に符号化することができる。符号化済みのバイトストリームを読み取ると、最初のバイト内で設定されるビットの数が、直接の子である連続バイトの数を復号器に知らせる。ビットの位置は、そのビットが占有する8分木内のボクセル/子を指定する。
図2の右側は、左側に示す8分木に関するこのバイトストリーム表現を示す。
【0014】
その階層的性質により、8分木表現は点群のスパース性を活用する際に非常に効率的である。従って、8分木分解に基づく戦略はスパースな点群を圧縮するのに非常に効率的である。しかし、8分木に基づく表現は隙のない密な点群を表現し圧縮するには非効率的である。更に、既存の8分木に基づく点群表現の殆どは点の幾何学的配置及び他の属性を独立に表す。
【0015】
第2の符号化手法は、区分化に基づく点群表現に基づく。これは例えばProc. Eurographics Symp. on Point-Based Graphics, 2004内のT. Ochotta及びD. Saupe, “Compression of point-based 3d models by shape-adaptive wavelet coding of multi-heightfields”、及びJ. Digne, R. Chaine, S. Valette, et al, “Self-similarity for accurate compression of point sampled surfaces,” Computer Graphics Forum, vol. 33, p.155-164, 2014の中で記載されている。
【0016】
区分化に基づく点群表現は、面様の分解、面の投影、及び符号化という3つのステップを含む。最初のステップにおいて、点群データを面様のパッチに区分化する。次いで、その結果生じるパッチを1つ又は幾つかの面上に投影する。最後のステップにおいて、投影像を圧縮する。投影像を圧縮するために、効率的な画像/映像圧縮技法を使用することができる。
【0017】
面様の区分化に基づくPCCは、おおよその区分線形面を表す密な点群を符号化するのに非常に効率的であることが分かっている。しかし、区分化に基づくPCCには幾つかの不利点がある。実際、この方法は規則的な格子上への再サンプリングを必要とし、かかる再サンプリングは近似誤差を引き起こす。更に、複雑な形状のために大量のパッチを生成する必要があり、そのことは複雑なテクスチャのための高い計算複雑さを含意する。更に、この方法は幾何学的配置及び他の特性を独立に処理する。
【0018】
Robotics and Automation (ICRA), 2012 IEEE International Conference on , pp.778,785, 14-18 May, 2012内のJ. K. N. Blodow, R. Rusu, S. Gedikli、及びE. S. M Beetz, “Real-time compression of point cloud streams”等、上記の2つの点群表現の利点を組み合わせようとする取り組みがある。
【0019】
それらの取り組みでは、8分木の分解のやり方で入力点群をまず分解する。それぞれの立方形分割操作の後、新たに生成される同じ葉の立方形に含まれる点が面によって近似され得るかどうかを確認する。近似され得る場合、対応する立方体の分割を停止し、対応する面上に投影することによって関連する点を符号化する。すると面様のパッチの位置が8分木の方法によって効率的に表現され圧縮され得る。
【0020】
しかしこれらの全ての既知の方法は、点群の属性データの効率的な表現及び符号化を提供しない。
【0021】
Collet et al. “High-quality streamable free-viewpoint video”, ACM Transactions on Graphics, vol.34, no.4, 2015の文献では点群が3Dメッシュに変換され、その後、点群を符号化するために最先端の3Dメッシュ圧縮技法が使用される。しかし、点群をメッシュに変換する必要があるこの方法は通常計算コストが高く、3Dメッシュの接続性を符号化するために余分なビットが必要になる。
【0022】
最近では点群を符号化するためのグラフに基づく方法が提案されている。点群の属性はZhang et al.: “Point cloud attribute compression with graph transform”, IEEE International Conference on Image Processing, Paris, 2014内のグラフ変換を使用して圧縮される。属性はグラフ上の信号として扱われ、信号の相関をおおよそ失わせるためにグラフ変換が使用される。しかし、8分木構造に基づいてグラフを構築することにより、点群表現は依然として8分木表現に基づく。更に、幾何学的配置を除く属性の圧縮だけがこの文献では検討されている。
【0023】
3D点群シーケンスを圧縮する問題は、グラフに基づく方法と共にイントラ符号化に重点を置いてThanou et al.: “Graph-based compression of dynamic 3D point cloud sequences,” IEEE Transactions on Image Processing, vol.25, n°4, pages 1765-1778, 2016の中で述べられている。それでもなお、この手法は8分木表現を依然として採用する。Queiroz et al. “Compression of 3D point clouds using a region-adaptive hierarchical transform”, IEEE Transactions on Image Processing, Volume: 25, Issue: 8, Aug. 2016では、階層変換に基づいて点群内の色を圧縮するための方法が設計されている。その一方で、点群の幾何学的配置はここでも8分木表現を使用して符号化される。
【0024】
上記の取り組みは全て8分木表現に基づき、幾何学的配置及び他の属性を別々に検討する。符号化効率を得るための点群の区分線形性の活用が8分木表現によって限定されるのでかかる形態は不利である。更に、幾何学的配置と属性との間の冗長性が考慮されておらず、そのことは符号化性能の更なる改善をなくす。
【発明の概要】
【0025】
発明の概要
本開示はこの状況を改善するための解決策を提案する。
【0026】
従って本開示は、請求項1に記載の点群を符号化するための方法、及び請求項2に記載の対応する符号器に関する。本開示は、請求項8に記載の点群を再構築するための方法、及び請求項9に記載の対応する復号器にも関する。本開示は、本発明の符号化方法及び再構築方法を実装するコンピュータプログラムに更に関する。本開示は請求項15に記載の信号にも関する。
【0027】
従って本開示は、複数の点を含む点群を符号化するための方法を提供し、各点は属性によって定められ、属性は3D空間内の点の空間位置及び点の少なくとも1つの特徴を含み、この方法は、
-点の属性に基づいて点群を点のクラスタへと区分化すること、
並びにクラスタごとに
-属性に関してクラスタの隣接点間の類似度を表す類似度グラフを構築すること、
-構築した類似度グラフに基づいてグラフフーリエ変換、GFTを計算することであって、GFTはその係数によって特徴付けられる、計算すること、及び
-GFT係数を量子化し符号化すること
を含む。
【0028】
従って本発明の符号化方法は、幾何学的配置、即ち3D空間内の点の空間位置及び少なくとも1つの他の属性、即ち色又はテクスチャ等の特徴を含む属性を一緒に圧縮し、GFTに基づいてそれらの間の冗長性を活用する。
【0029】
点群をクラスタに区分化することによって各クラスタ内でグラフ変換操作が行われ、従って処理時間の意味でより効率的である。
【0030】
有利にはこの方法は、クラスタごとに、符号化済みのGFT係数並びにクラスタの識別情報及び計算済みのGFTの識別情報を復号器に伝送することを含む。
【0031】
どのGFTがどのクラスタに使用されるのかを復号器に示し、それにより点群の最終的な再構築に復号器が正しい逆変換を行うことができるように、これらの識別情報はクラスタインデックス及びGFTインデックスで構成され得る。
【0032】
好ましい実施形態によれば、GFT係数の符号化がエントロピ符号化である。
【0033】
有利には、点群のクラスタへの区分化が正規化カット技法を使用する。
【0034】
この技法は、例えばIEEE Trans. Pattern Anal. Mach. Intell., Vol.22, No.8, pages 888-905, 2000内のMalik et al.: “Normalized cuts and image segmentation”の文献の中で記載されている。
【0035】
好ましくは、構築される類似度グラフの頂点が対応するクラスタの点で構成され、この方法がグラフの任意の頂点Pi及びPj間に重みwi,jを割り当てることを含む。
【0036】
有利には、前述の重みが閾値を下回る場合は頂点Pi及びPj間の重みwi,jを0に設定する。
【0037】
このようにして、小さな重みは対応する接続された頂点が或る程度異なることを意味するので、符号化の質を落とすことなしに全体的な符号化ビットを低減するために小さな重みは符号化しない。
【0038】
有利には、類似度グラフを構築することは、重みwi,jが閾値以上の場合に頂点Pi及びPj間に辺ei,jを追加することを含む。
【0039】
本開示は、複数の点を含む点群を符号化するための符号器も提供し、各点は属性によって定められ、属性は3D空間内の点の空間位置及び点の少なくとも1つの特徴を含み、この符号器は、
-点の属性に基づいて点群を点のクラスタへと区分化するように構成される区分化モジュールと、
-属性に関してクラスタの隣接点間の類似度を表す類似度グラフをクラスタごとに構築するように構成される構築モジュールと、
-構築された類似度グラフに基づいてグラフフーリエ変換、GFTをクラスタごとに計算するように構成される計算モジュールであって、GFTはその係数によって特徴付けられる、計算モジュールと、
-GFT係数を符号化するように構成される符号化モジュールと
を含む。
【0040】
有利にはこの符号器は、符号化済みのGFT係数並びにクラスタの識別情報及び計算済みのGFTの識別情報を復号器に伝送するように構成される送信機を含む。
【0041】
本開示は、複数の点を含む点群を再構築するための方法も提供し、各点は属性によって定められ、属性は3D空間内の点の空間位置及び点の少なくとも1つの特徴を含み、この方法は、
-クラスタインデックス及びGFTインデックスに関連するGFT係数を含むデータを受信すること、
-受信したデータを復号すること、及び
-受信したクラスタインデックスによって識別されるクラスタごとに逆GFTを実行することによってクラスタを再構築すること
を含む。
【0042】
有利には復号がエントロピ復号を含む。
【0043】
本開示は、複数の点を含む点群を再構築するための復号器も提供し、各点は属性によって定められ、属性は3D空間内の点の空間位置及び点の少なくとも1つの特徴を含み、この復号器は、
-クラスタインデックス及びGFTインデックスに関連するGFT係数を含む符号化済みのデータを受信するように構成される受信機と、
-受信されたデータを復号するように構成される復号モジュールと、
-受信されたクラスタインデックスによって識別されるクラスタごとに逆GFTを実行することによってクラスタを再構築するように構成される再構築モジュールと
を含む。
【0044】
本開示による方法はプログラム可能機器上のソフトウェアによって実装することができる。これらの方法はハードウェア若しくはソフトウェアだけによって、又はそれらの組み合わせによって実装することができる。
【0045】
これらの方法はソフトウェアによって実装可能なので、これらの方法は任意の適切なキャリア媒体上でプログラム可能機器に与えるためのコンピュータ可読コードとして具体化することができる。キャリア媒体は、フロッピディスク、CD-ROM、ハードディスクドライブ、磁気テープ装置、又はソリッドステートメモリ装置等の記憶媒体を含み得る。
【0046】
従って本開示は、本発明の符号化方法をコンピュータが実行できるようにするためのコンピュータ実行可能命令を含むコンピュータ可読プログラムを提供する。
【0047】
図3の図面は、かかるコンピュータプログラムのための全般的なアルゴリズムの一例を示す。
【0048】
本開示は、本発明の再構築方法をコンピュータが実行できるようにするためのコンピュータ実行可能命令を含むコンピュータ可読プログラムも提供する。
【0049】
図4の図面は、かかるコンピュータプログラムのための全般的なアルゴリズムの一例を示す。
【0050】
図面の簡単な説明
本発明を添付図面の図中に限定ではなく例として示し、図中、同様の参照番号は同様の要素を指す。
【図面の簡単な説明】
【0051】
【
図1】既に説明しており、従来技術による8分木に基づく点群表現を示す概略図である。
【
図2】既に説明しており、8分木データ構造の全体像を示す概略図である。
【
図3】本発明の一実施形態による、点群を符号化するステップを示す流れ図である。
【
図4】本発明の一実施形態による、点群を再構築するステップを示す流れ図である。
【
図5】本発明の一実施形態による符号器を示す概略図である。
【
図6】本発明の一実施形態による復号器を示す概略図である。
【発明を実施するための形態】
【0052】
好ましい実施形態の詳細な説明
本発明の一実施形態による、点群を符号化する方法を
図3の流れ図に示す。
【0053】
点群PCの点は、幾何学的配置、即ち各点の空間位置及び例えば色等の点の少なくとも別の属性を含むその属性によって特徴付けられる。以下の説明では点群の各点が、3D空間内の幾何学的配置g及びRGB空間内の色cという2つの属性を有すると仮定する。
【0054】
ステップ2で、点群データを幾つかのクラスタに分類する。殆どの点群データが区分線形挙動を有することが概して認められているので、このクラスタリングの結果、各クラスタ内の点群データが線形関数によって近似され得る。
【0055】
このクラスタリングは従来技術による任意のクラスタリング方法によって実行することができる。
【0056】
有利には、このクラスタリングは、点群の点の全ての属性間の類似度を考慮するために本実施形態に従って修正される正規化カット技法を使用して実行される。
【0057】
従ってクラスタリングを実行するとき、多面的な関係が考慮される。つまり、区分線形特性を最適な方法で活用するクラスタリング結果を実現するために、幾何学的配置及び色等の他の属性の両方の類似度を考慮して点群を区分化する。
【0058】
ステップ2の終わりにおいて、点群PCは対応するインデックスによって識別される複数のクラスタCiへとクラスタリングされており、1≦i≦Nであり、Nは得られたクラスタの数である。クラスタのインデックスは、クラスタごとに一意のインデックスが割り当てられることを確実にしながら無作為に割り当てられる。
【0059】
次いでステップ4で、クラスタごとに類似度グラフを構築する。この類似度グラフはクラスタの隣接する頂点、即ち点間の類似度を表し、クラスタのコンパクト表現を取得することを可能にする。
【0060】
グラフG={V,E,W}は、濃度|V|=Nを有する1組の有限の頂点V、頂点を接続する1組の辺E、及び重み付き隣接行列Wで構成される。WはNxNの実行列であり、wi,jは頂点Pi及びPjを接続する辺(i,j)に割り当てられる重みである。ここでは対称重み付き隣接行列、即ちwi,j=wj,iに対応する無向グラフだけを検討する。重みは非負、即ちwi,j≧0だと仮定する。
【0061】
ステップ4で構築した類似度グラフにおいて、頂点Pi及び頂点Pj間の重みw
i,jは
【数1】
として割り当てられ、g
i及びg
jはそれぞれ座標ベクトル、即ちg
i=(x
i,y
i,z
i)
T及びg
j=(x
j,y
j,z
j)
Tであり、c
i及びc
jはそれぞれ色ベクトル、即ちc
i=(r
i,g
i,b
i)
T及びc
j=(r
j,g
j,b
j)
Tである。この公式では||g
i-g
j||
2は幾何学的配置の類似度を示し、||c
i-c
j||
2は色の類似度を示す。
【0062】
σは重みの値を制御するために使用されるパラメータであり、しばしば経験的に設定される。
【0063】
このようにして、構築されるグラフにおいて幾何学的配置情報及び色情報の両方が考慮され、これは1つの属性の類似度しか考慮しない辺の重みの通常の定義と異なる。
【0064】
好ましい実施形態によれば、及びスパース表現に関する接続された頂点の数を減らすために、閾値tを使用して小さな重みを以下のように0に設定する:
wi,j<tが成立する場合、wi,j=0 (2)
【0065】
このようにして、符号化ビットを節約するために小さな重みは符号化しない。更に、これらの重みは小さく、接続された頂点が或る程度異なることを意味するので、これらの重みを0に設定することは符号化の質を殆ど落とさない。
【0066】
従ってグラフは以下のように構築される。
【0067】
クラスタの点Piごとに、点Pi及びクラスタ内の他の任意の点Pj間のあり得る辺の重みを方程式(1)に従って計算している。wi,j>=tが成立する場合、Pi及びPj間の辺ei,jを追加し、計算済みの重みwi,jをその辺に付加し、さもなければ小さな重みはそれらの点の間に大きな相違があることを意味するのでPiとPjとの接続を解除する。
【0068】
次いでステップ6で、構築した類似度グラフに基づいてクラスタごとにGFTを計算する。このステップにおいて、グラフの重みから重み付き隣接行列が得られる。
【0069】
次いでグラフのラプラシアン行列を計算する。
【0070】
ラプラシアン行列の様々な改変形態が存在する。
【0071】
一実施形態では、L:=D-Wとして定められる非正規化組合せグラフラプラシアンを使用し、Dはそのi番目の対角成分がWのi番目の行内の全ての成分の和、即ち
【数2】
である対角行列として定められる次数行列である。ラプラシアン行列は実対称行列なので、ラプラシアン行列は、1組の完全な正規直交固有ベクトル{Ψ
l}
l=0,1,...,N-1と共に1組の実固有値{λl}
l=0,1,...,N-1を認め、即ちl=0,1,...,N-1ではLΨ
l=λ
lΨ
lである。
【0072】
一実施形態では、このラプラシアン行列を2つの理由で採用する。
【0073】
まず、Lの各行内の成分の和は構造によって0になるので、対応する固有ベクトルとしての[1...1]Tと共に0が固有値であることが保証される。このことはGFTの周波数解釈を可能にし、固有値λlはグラフ周波数であり常にDC成分を有し、これは多くの平滑領域で構成される点群データを圧縮するのに有益である。類似する点を接続し異なる点の接続を解除することによって高周波係数(high-frequency coefficient)が低減され、そのことはGFT領域内の点群のコンパクト表現につながる。
【0074】
第2に、全ての辺の重みが1に等しい状態で、(1D DCTに対応する)線グラフ又は4接続グラフ(2D DCT)について定められる場合、GFTはデフォルトで良く知られているDCTとなる。つまり、このように重みを選択した場合、GFTはスパース信号表現において少なくともDCTと同程度優れている。上記の2つの所望の特性により、以下の段落の中で説明するように、GFTを定義するために非正規化ラプラシアン行列を使用する。
【0075】
GFTを定義するために、ラプラシアン行列の固有ベクトル{Ψ
l}
l=0,1,...,N-1を使用する。形式的に、Gの頂点上にある任意の信号x∈R
Nについて、その
【数3】
は次式
【数4】
として定められ、
【数5】
はl番目のGFT係数であり、ここでx(n)は点群の点nの属性を指す。
【0076】
クラスタごとに、得られるGFTがGFTインデックスによって識別される。
【0077】
従って、ステップ6はGFT係数及びGFTインデックスをもたらす。
【0078】
次いでステップ8で、GFT係数を量子化する。
【0079】
ステップ10で、例えばMarpe: “Context-Based Adaptive Binary Arithmetic Coding in the H.264/AVC Video Compression Standard”, IEEE Trans. Cir. and Sys. For Video Technol., vol.13, no.7, pages 620-636, 2003の中で記載されているCABAC法を使用することにより、量子化済みのGFT係数をエントロピ符号化する。
【0080】
更にステップ10で、クラスタインデックス及びGFTインデックスによって構成されるオーバヘッドをエントロピ符号化してどのGFTがどのクラスタに使用されるのかを示す。次いでステップ12で、符号化済みのGFT係数、クラスタインデックス、及びGFTインデックスを復号器に伝送する。
【0081】
図4は、本開示の一実施形態による点群を再構築するステップ、即ち符号化済みのGFT係数、クラスタインデックス、及びGFTインデックスを受信した後で復号器によって実施される復号ステップを示す。
【0082】
ステップ20で、受信したGFT係数、クラスタインデックス、及びGFTインデックスをエントロピ復号する。
【0083】
次いでステップ22で、復号したGFT係数を逆量子化する。
【0084】
ステップ24で、逆量子化したGFT係数及び復号したGFTインデックス(適用済みのGFTを示す)を使用して逆GFTを実行する。
【0085】
逆GFTは
【数6】
によって得られ、但しxは各クラスタの点群データを表す回復済みの信号である。
【0086】
一実施形態によれば、グラフフーリエ変換は以下のように計算し、点群内の各点はグラフ内の頂点として扱う。
【0087】
まず、各点をその近傍にそれらが類似する限り接続する。各点と近傍との間に大きな相違がある場合は2点の接続を解除する。
【0088】
第2に、接続グラフを所与として隣接行列Wを定め、頂点i及びjが接続される場合はwi,j=wj,i=1であり、さもなければ0である。次いで次数行列Dを計算する。
【0089】
第3のステップで、計算済みの行列W及びDを使用し、L=D-Wとしてグラフラプラシアン行列を計算する。Lの固有ベクトルUはGFTの基底ベクトルである。最後に点群の点の属性を列ベクトル内にスタックし、方程式3及び4に従ってGFT及び逆GFTを計算する。
【0090】
類似する点を接続し異なる点の接続を解除することによって高周波係数が低減され、そのためGFT領域内の点群のコンパクト表現につながる。
【0091】
図5は、本開示の符号化方法を実装する符号器30の例示的実施形態のブロック図である。
【0092】
有利には、符号器30は1つ又は複数のプロセッサ及びメモリ32を含む。
【0093】
符号器30は、
-点の属性に基づいて点群を点のクラスタへと区分化するように構成される区分化モジュール34と、
-属性に関してクラスタの隣接点間の類似度を表す類似度グラフをクラスタごとに構築するように構成される構築モジュール36と、
-構築された類似度グラフに基づいてグラフフーリエ変換、GFTをクラスタごとに計算するように構成される計算モジュール38であって、GFTはその係数によって特徴付けられる、計算モジュール38と、
-GFT係数を符号化するように構成される符号化モジュール40と
を含む。
【0094】
符号器30は、符号化済みのGFT係数並びにクラスタの識別情報及び計算済みのGFTの識別情報を復号器に伝送するように構成される送信機42も含む。
【0095】
記載の実施形態によれば、バス44が符号器30の様々な要素間の通信経路を提供する。他の2点間相互接続の選択肢(例えば非バスアーキテクチャ)も可能である。
【0096】
図6は、本開示の再構築方法を実装する復号器50の例示的実施形態のブロック図である。
【0097】
有利には、復号器50は1つ又は複数のプロセッサ及びメモリ52を含む。
【0098】
復号器50は、
-クラスタインデックス及びGFTインデックスに関連するGFT係数を含む符号化済みのデータを受信するように構成される受信機54と、
-受信されたデータを復号するように構成される復号モジュール66と、
-クラスタごとに逆GFTを実行することによってクラスタを再構築するように構成される再構築モジュール58と
を含む。
【0099】
記載の実施形態によれば、バス60が復号器50の様々な要素間の通信経路を提供する。他の2点間相互接続の選択肢(例えば非バスアーキテクチャ)も可能である。
【0100】
本発明の好ましい実施形態だと現在考えられる内容を図示し説明してきたが、本発明の真の範囲から逸脱することなしに他の様々な修正を加えることができ、等価物を置換できることを当業者なら理解されよう。加えて、本明細書に記載した本発明の主要概念から逸脱することなしに、本発明の教示に特定の状況を適合させるために多くの修正を加えることができる。更に、本発明の実施形態は上記の特徴の全てを含まなくてもよい。従って、開示した特定の実施形態に本発明を限定することは意図せず、本発明は添付の特許請求の範囲に含まれる全ての実施形態を含むことを意図する。
【0101】
「含む(comprise)」、「含む(include)」、「組み込む(incorporate)」、「含有する(contain)」、「である(is)」、及び「有する(have)」等の表現は、この説明及び関連する特許請求の範囲を解釈するとき非排他的方法で解釈すべきであり、つまり更に存在することが明確に定められていない他のアイテム又は構成要素を認めるように解釈すべきである。単数形の言及は複数形の言及とも解釈すべきであり、その逆も同様である。
【0102】
本発明の範囲から逸脱することなしに、本明細書で開示した様々なパラメータを修正できること、並びに開示し及び/又は特許請求の範囲に記載した様々な実施形態を組み合わせることができることを当業者なら容易に理解されよう。
【0103】
例えば、記載したグラフ変換がGFTでも、例えばElsevier: Applied and Computational Harmonic Analysis, vol.30, April 2010, pp.129-150内のD. Hammond, P. Vandergheynst、及びR. Gribonval, “Wavelets on graphs via spectral graph theory”に記載されているwavelets on graphs、及びPh.D. dissertation, University of Southern California, 2010内のG. Shen, “Lifting transforms on graphs: Theory and applications”に記載されているlifting transforms on graphs等の他のグラフ変換を使用することもできる。
なお、上述の実施形態の一部又は全部は、以下の付記のように記載され得るが、以下には限定されない。
(付記1)
属性によって定められる複数の点を含む点群(PC)にアクセスすることであって、前記属性は3D空間内の点の空間位置及び前記点の少なくとも1つの特徴を含む、アクセスすること、
前記点の前記属性に基づいて前記点群(PC)を点の1つ又は複数のクラスタ(C
i
)へと区分化すること(2)、
並びに少なくとも1つのクラスタ(C
i
)について、
複数の頂点及び少なくとも1つの辺を有する類似度グラフを構築すること(4)であって、前記類似度グラフは前記属性に関して前記クラスタ(C
i
)の隣接点間の類似度を表し、前記複数の頂点は前記クラスタ(C
i
)の点に対応する頂点P
i
及びPjを含む、構築すること(4)、
前記グラフの頂点P
i
とPjとを接続する1つ又は複数の辺に1つ又は複数の重みw
i,j
を割り当てること、
前記1つ又は複数の割り当てた重みを使用して変換を計算すること(6)であって、前記変換は係数によって特徴付けられる、計算すること(6)、及び
前記変換係数を量子化し(8)符号化する(10)こと
を含む、方法。
(付記2)
点群(PC)を符号化するための装置(30)であって、
属性によって定められる複数の点を含む前記点群であって、前記属性は3D空間内の点の空間位置及び前記点の少なくとも1つの特徴を含む、前記点群を前記点の前記属性に基づいて点の1つ又は複数のクラスタへと区分化するように構成される区分化モジュール(34)と、
少なくとも1つのクラスタ(C
i
)について、複数の頂点及び少なくとも1つの辺を有する類似度グラフを構築することであって、前記類似度グラフは前記属性に関して前記クラスタ(C
i
)の隣接点間の類似度を表し、前記複数の頂点は前記クラスタ(C
i
)の点に対応する頂点P
i
及びPjを含む、構築すること、及び前記グラフの頂点P
i
とPjとを接続する1つ又は複数の辺に1つ又は複数の重みw
i,j
を割り当てることを行うように構成される構築モジュール(36)と、
少なくとも1つのクラスタについて、前記1つ又は複数の割り当てられた重みを使用して変換を計算するように構成される計算モジュール(38)であって、前記変換は係数によって特徴付けられる、計算モジュール(38)と、
前記変換係数を量子化し符号化するように構成される符号化モジュール(40)と
を含む、装置(30)。
(付記3)
少なくとも1つのクラスタ(C
i
)について、前記符号化済みの変換係数並びに前記クラスタ(C
i
)の識別情報及び前記計算済みの変換の識別情報を復号器(50)に伝送するステップ(12)を前記方法が含み、又は伝送するための手段(42)を前記装置が含む、付記1に記載の方法又は付記2に記載の装置。
(付記4)
前記変換係数の前記符号化がエントロピ符号化である、付記1若しくは3に記載の方法又は付記2若しくは3に記載の装置。
(付記5)
前記重みw
i,j
が閾値を下回る場合は前記重みを0に設定し、頂点Pi及びPjの接続を解除する、付記1若しくは3~4の何れか一に記載の方法又は付記2~4の何れか一に記載の装置。
(付記6)
前記変換がグラフフーリエ変換、GFTである、付記1若しくは3~5の何れか一に記載の方法又は付記2~5の何れか一に記載の装置。
(付記7)
前記少なくとも1つの特徴が色情報を含む、付記1若しくは3~6の何れか一に記載の方法又は付記2~6の何れか一に記載の装置。
(付記8)
属性によって定められる複数の点を含む点群(PC)の1つ又は複数のクラスタのインデックスに関連する変換係数を含むデータを受信することであって、前記属性は3D空間内の点の空間位置及び前記点の少なくとも1つの特徴を含む、受信すること、
前記受信したデータを復号すること(20)、及び
受信したクラスタインデックスによって識別される少なくとも1つのクラスタについて逆変換を実行すること(24)によって前記点群の前記1つ又は複数のクラスタ(Ci)を再構築すること
を含む、方法。
(付記9)
点群を再構築するための装置(50)であって、
属性によって定められる複数の点を含む前記点群の1つ又は複数のクラスタのインデックスに関連する変換係数を含むデータを受信するように構成される受信機(54)であって、前記属性は3D空間内の点の空間位置及び前記点の少なくとも1つの特徴を含む、受信機(54)と、
前記受信されたデータを復号するように構成される復号モジュール(56)と、
受信されたクラスタインデックスによって識別される少なくとも1つのクラスタについて逆変換を実行することによって前記点群の前記1つ又は複数のクラスタを再構築するように構成される再構築モジュール(58)と
を含む、装置(50)。
(付記10)
前記復号がエントロピ復号を含む、付記8に記載の方法又は付記9に記載の装置。
(付記11)
前記変換がグラフフーリエ変換、GFTである、付記8若しくは10に記載の方法又は付記9若しくは10に記載の装置。
(付記12)
付記1又は3~7の何れか一に記載の符号化方法をコンピュータが実行できるようにするためのコンピュータ実行可能命令を含む、コンピュータ可読プログラム。
(付記13)
付記8又は10又は11の何れか一に記載の再構築方法をコンピュータが実行できるようにするためのコンピュータ実行可能命令を含む、コンピュータ可読プログラム。
(付記14)
付記1若しくは3~7の何れか一に記載の方法に従って又は付記2~7の何れか一に記載の装置によって生成されるデータコンテンツを含む、非一時的コンピュータ可読媒体。
(付記15)
付記1若しくは3~7の何れか一に記載の方法に従って又は付記2~7の何れか一に記載の装置によって生成されるデータを含む、信号。