(19)【発行国】日本国特許庁(JP)
(12)【公報種別】公開特許公報(A)
(11)【公開番号】P2024152417
(43)【公開日】2024-10-25
(54)【発明の名称】点群復号装置、点群復号方法及びプログラム
(51)【国際特許分類】
G06T 9/40 20060101AFI20241018BHJP
【FI】
G06T9/40
【審査請求】未請求
【請求項の数】9
【出願形態】OL
(21)【出願番号】P 2023066600
(22)【出願日】2023-04-14
【国等の委託研究の成果に係る記載事項】(出願人による申告)令和5年度、総務省、「3次元空間データの無線伝送に向けた高能率圧縮技術の研究開発」、産業技術力強化法第17条の適用を受ける特許出願
(71)【出願人】
【識別番号】000208891
【氏名又は名称】KDDI株式会社
(74)【代理人】
【識別番号】110001564
【氏名又は名称】フェリシテ弁理士法人
(72)【発明者】
【氏名】中塚 智尋
(72)【発明者】
【氏名】海野 恭平
(72)【発明者】
【氏名】小森田 賢史
(57)【要約】 (修正有)
【課題】符号化の圧縮性能を向上させる、点群復号方法及びプログラムを提供する。
【解決手段】点群符号化装置及び点群復号装置を有する点群処理システムにおいて、点群復号装置200は、Predictive codingのAngularモードにおいて、センサータイプまたは動作モードによって異なる処理をするツリー合成部2020を備え、センサータイプまたは動作モードの値の切り替えによって、Spinning LiDARデータに対する処理とNon-Spinning LiDARデータに対する処理の両方に対応する。
【選択図】
図2
【特許請求の範囲】
【請求項1】
点群復号装置であって、
Predictive codingのAngularモードにおいて、センサータイプ或いは動作モードによって異なる処理をするツリー合成部を備えることを特徴とする点群復号装置。
【請求項2】
前記ツリー合成部は、前記Angularモードにおいて、前記センサータイプがNon-Spinning LiDARデータを示す場合或いは前記動作モードが仰角成分の予測及び残差復号の有効化を示す場合、極座標変換後の座標値r、θ、φのそれぞれについて、予測、残差復号及び座標再構成の処理を行うことを特徴とする請求項1に記載の点群復号装置。
【請求項3】
前記ツリー合成部は、前記Angularモードにおいて、前記センサータイプがNon-Spinning LiDARデータを示す場合或いは前記動作モードが仰角成分の予測及び残差復号の有効化を示す場合に、極座標変換後の座標値r、θ、φのうちのθ、φに座標変換を適用した後の座標値r、θ、φのそれぞれについて、予測、残差復号及び座標再構成の処理を行うことを特徴とする請求項1に記載の点群復号装置。
【請求項4】
前記ツリー合成部は、前記Angularモードにおいて、前記センサータイプがNon-Spinning LiDARデータを示す場合或いは前記動作モードが仰角成分の予測及び残差復号の有効化を示す場合に、複数の点のうちの1点で予測を行い、他の点との共通の予測値として扱うことを特徴とする請求項1に記載の点群復号装置。
【請求項5】
前記ツリー合成部は、前記Angularモードにおいて、前記センサータイプがNon-Spinning LiDARデータを示す場合或いは前記動作モードが仰角成分の予測及び残差復号の有効化を示す場合に、インター予測で、参照フレームから極座標変換後の座標値θとφの値に基づいて予測器を選出することを特徴とする請求項1に記載の点群復号装置。
【請求項6】
前記ツリー合成部は、前記Angularモードにおいて、前記センサータイプがNon-Spinning LiDARデータを示す場合或いは前記動作モードが仰角成分の予測及び残差復号の有効化を示す場合に、インター予測で、参照フレームからノードIDに基づいて予測器を選出することを特徴とする請求項1に記載の点群復号装置。
【請求項7】
前記ツリー合成部は、前記Angularモードにおいて、前記センサータイプがNon-Spinning LiDARデータを示す場合或いは前記動作モードが仰角成分の予測及び残差復号の有効化を示す場合に、インター予測で、参照フレームの予測木の枝IDに基づいて予測器を選出することを特徴とする請求項5又は6に記載の点群復号装置。
【請求項8】
点群復号方法であって、
Predictive codingのAngularモードにおいて、センサータイプ或いは動作モードによって異なる処理をする工程を有することを特徴とする点群復号方法。
【請求項9】
コンピュータを、点群復号装置として機能させるプログラムであって、
前記点群復号装置は、
Predictive codingのAngularモードにおいて、センサータイプ或いは動作モードによって異なる処理をするツリー合成部を備えることを特徴とするプログラム。
【発明の詳細な説明】
【技術分野】
【0001】
本発明は、点群復号装置、点群復号方法及びプログラムに関する。
【背景技術】
【0002】
非特許文献1では、Predictive codingにおいて、Spinning LiDARデータを対象にデータの特性や偏りを考慮するAngularモードでイントラ予測を行う技術が開示されている。
【0003】
また、非特許文献2では、Predictive codingにおいて、Spinning LiDARデータを対象にデータの特性や偏りを考慮するAngularモードでインター予測を行う技術が開示されている。
【先行技術文献】
【非特許文献】
【0004】
【非特許文献1】G-PCC codec description、ISO/IEC JTC1/SC29/WG7 N00271
【非特許文献2】G-PCC 2nd Edition codec description、ISO/IEC JTC1/SC29/WG7 N00314
【発明の概要】
【発明が解決しようとする課題】
【0005】
しかしながら、非特許文献1の方法では、Non-spinning LiDARデータに対して、データの特性や偏りを考慮せずイントラ予測を行うため、圧縮性能が損なわれるという問題点があった。
【0006】
また、非特許文献2の方法では、Non-spinning LiDARデータに対して、インター予測を適応することができないため、圧縮性能が損なわれるという問題点があった。
【0007】
そこで、本発明は、上述の課題に鑑みてなされたものであり、符号化の圧縮性能を向上させることができる点群復号装置、点群復号方法及びプログラムを提供することを目的とする。
【課題を解決するための手段】
【0008】
本発明の第1の特徴は、点群復号装置であって、Predictive codingのAngularモードにおいて、センサータイプ或いは動作モードによって異なる処理をするツリー合成部を備えることを要旨とする。
【0009】
本発明の第2の特徴は、点群復号方法であって、Predictive codingのAngularモードにおいて、センサータイプ或いは動作モードによって異なる処理をする工程を有することを要旨とする。
【0010】
本発明の第3の特徴は、コンピュータを、点群復号装置として機能させるプログラムであって、前記点群復号装置は、Predictive codingのAngularモードにおいて、センサータイプ或いは動作モードによって異なる処理をするツリー合成部を備えることを要旨とする。
【発明の効果】
【0011】
本発明によれば、符号化の圧縮性能を向上させることができる点群復号装置、点群復号方法及びプログラムを提供することができる。
【図面の簡単な説明】
【0012】
【
図1】
図1は、一実施形態に係る点群処理システム10の構成の一例を示す図である。
【
図2】
図2は、一実施形態に係る点群復号装置200の機能ブロックの一例を示す図である。
【
図3】
図3は、一実施形態に係る点群復号装置200の幾何情報復号部2010で受信する符号化データ(ビットストリーム)の構成の一例を示す図である。
【
図4】
図4は、GPS2011のシンタックス構成の一例を示す図である。
【
図5】
図5は、一実施形態に係る点群復号装置200のツリー合成部2020における処理の一例を示すフローチャートである
【
図6】
図6は、ステップS505におけるスライスデータの復号処理の一例を示すフローチャートである。
【
図7】
図7は、座標変換の1つである極座標系への変換処理の一例を説明するための図である。
【
図8A】
図8Aは、センサータイプを制御するフラグがSpinning LiDARデータを示す場合の処理の一例を説明するための図である。
【
図8B】
図8Bは、センサータイプを制御するフラグがNon-spinning LiDARデータを示す場合の処理の一例について説明するための図である。
【
図9】
図9は、ステップS604における予測の方法の一例について説明するための図である。
【
図10】
図10は、ステップS604における座標予測の処理の一例を示すフローチャートである。
【
図11】
図11は、ステップS1004において、Angularモードにおいて、センサータイプがNon-Spinning LiDARを示す場合或いは仰角成分の予測及び残差復号が有効な場合に、参照フレームから予測器を選出する処理の一例について説明するための図である。
【
図12】
図12は、ステップS1004において、Angularモードにおいて、センサータイプがNon-Spinning LiDARを示す場合或いは仰角成分の予測及び残差復号が有効な場合に、参照フレームから予測器を選出する処理の一例について説明するための図である。
【
図13】
図13は、本実施形態に係る点群符号化装置100の機能ブロックの一例について示す図である。
【発明を実施するための形態】
【0013】
以下、本発明の実施の形態について、図面を参照しながら説明する。なお、以下の実施形態における構成要素は、適宜、既存の構成要素等との置き換えが可能であり、また、他の既存の構成要素との組み合わせを含む様々なバリエーションが可能である。したがって、以下の実施形態の記載をもって、特許請求の範囲に記載された発明の内容を限定するものではない。
【0014】
(第1実施形態)
以下、
図1~
図13を参照して、本発明の第1実施形態に係る点群処理システム10について説明する。
図1は、本実施形態に係る実施形態に係る点群処理システム10を示す図である。
【0015】
図1に示すように、点群処理システム10は、点群符号化装置100及び点群復号装置200を有する。
【0016】
点群符号化装置100は、入力点群信号を符号化することによって符号化データ(ビットストリーム)を生成するように構成されている。点群復号装置200は、ビットストリームを復号することによって出力点群信号を生成するように構成されている。
【0017】
なお、入力点群信号及び出力点群信号は、点群内の各点の位置情報と属性情報とから構成される。属性情報は、例えば、各点の色情報や反射率である。
【0018】
ここで、かかるビットストリームは、点群符号化装置100から点群復号装置200に対して伝送路を介して送信されてもよい。また、ビットストリームは、記憶媒体に格納された上で、点群符号化装置100から点群復号装置200に提供されてもよい。
【0019】
(点群復号装置200)
以下、
図2を参照して、本実施形態に係る点群復号装置200について説明する。
図2は、本実施形態に係る点群復号装置200の機能ブロックの一例について示す図である。
【0020】
図2に示すように、点群復号装置200は、幾何情報復号部2010と、ツリー合成部2020と、近似表面合成部2030と、幾何情報再構成部2040と、逆座標変換部2050と、属性情報復号部2060と、逆量子化部2070と、RAHT部2080と、LoD算出部2090と、逆リフティング部2100と、逆色変換部2110と、フレームバッファ2120とを有する。
【0021】
幾何情報復号部2010は、点群符号化装置100から出力されるビットストリームのうち、幾何情報に関するビットストリーム(幾何情報ビットストリーム)を入力とし、シンタックスを復号するように構成されている。
【0022】
復号処理は、例えば、コンテクスト適応二値算術復号処理である。ここで、例えば、シンタックスは、位置情報の復号処理を制御するための制御データ(フラグやパラメータ)を含む。
【0023】
ツリー合成部2020は、幾何情報復号部2010によって復号された制御データ及び後述するツリー内のどのノードに点群が存在するかを示すoccupancy codeを入力として、復号対象空間内のどの領域に点が存在するかというツリー情報を生成するように構成されている。
【0024】
なお、occupancy codeの復号処理をツリー合成部2020内部で行うよう構成されていてもよい。
【0025】
本処理は、復号対象空間を直方体で区切り、occupancy codeを参照して各直方体内に点が存在するかを判断し、点が存在する直方体を複数の直方体に分割し、occupancy codeを参照するという処理を再帰的に繰り返すことで、ツリー情報を生成することができる。
【0026】
ここで、かかるoccupancy codeの復号に際して、後述するインター予測を用いてもよい。
【0027】
本実施形態では、上述の直方体を常に立方体として8分木分割を再帰的に行う「Octree」と呼ばれる手法、及び、8分木分割に加え、4分木分割及び2分木分割を行う「QtBt」と呼ばれる手法を使用することができる。QtBt」を使用するか否かは、制御データとして点群符号化装置100側から伝送される。
【0028】
或いは、制御データによってPredictive geometry codingを使用するように指定された場合、ツリー合成部2020は、点群符号化装置100において決定した任意のツリー構成に基づいて各点の座標を復号するように構成されている。
【0029】
近似表面合成部2030は、ツリー合成部2020によって生成されたツリー情報を用いて近似表面情報を生成し、かかる近似表面情報に基づいて点群を復号するように構成されている。
【0030】
近似表面情報は、例えば、物体の3次元点群データを復号する際等において、点群が物体表面に密に分布しているような場合に、個々の点群を復号するのではなく、点群の存在領域を小さな平面で近似して表現したものである。
【0031】
具体的には、近似表面合成部2030は、例えば、「Trisoup」と呼ばれる手法で、近似表面情報を生成し、点群を復号することができる。「Trisoup」の具体的な処理例については後述する。また、Lidar等で取得した疎な点群を復号する場合は、本処理を省略することができる。
【0032】
幾何情報再構成部2040は、ツリー合成部2020によって生成されたツリー情報及び近似表面合成部2030によって生成された近似表面情報を元に、復号対象の点群データの各点の幾何情報(復号処理が仮定している座標系における位置情報)を再構成するように構成されている。
【0033】
逆座標変換部2050は、幾何情報再構成部2040によって再構成された幾何情報を入力として、復号処理が仮定している座標系から、出力点群信号の座標系に変換を行い、位置情報を出力するように構成されている。
【0034】
フレームバッファ2120は、幾何情報再構成部2040によって再構成された幾何情報を入力として、参照フレームとして保存するように構成されている。保存した参照フレームは、ツリー合成部2020において時間的に異なるフレームのインター予測を行う場合に、フレームバッファ2130から読み出されて参照フレームとして使用される。
【0035】
ここで、各フレームに対してどの時刻の参照フレームを用いるかどうかは、例えば、点群符号化装置100からビットストリームとして伝送されてくる制御データに基づいて決定されてもよい。
【0036】
属性情報復号部2060は、点群符号化装置100から出力されるビットストリームのうち、属性情報に関するビットストリーム(属性情報ビットストリーム)を入力とし、シンタックスを復号するように構成されている。
【0037】
復号処理は、例えば、コンテクスト適応二値算術復号処理である。ここで、例えば、シンタックスは、属性情報の復号処理を制御するための制御データ(フラグ及びパラメータ)を含む。
【0038】
また、属性情報復号部2060は、復号したシンタックスから、量子化済み残差情報を復号するように構成されている。
【0039】
逆量子化部2070は、属性情報復号部2060によって復号された量子化済み残差情報と、属性情報復号部2060によって復号された制御データの一つである量子化パラメータとを元に、逆量子化処理を行い、逆量子化済み残差情報を生成するように構成されている。
【0040】
逆量子化済み残差情報は、復号対象の点群の特徴に応じて、RAHT部2080及びLoD算出部2090のいずれかに出力される。いずれに出力されるかは、属性情報復号部2060によって復号される制御データによって指定される。
【0041】
RAHT部2080は、逆量子化部2070によって生成された逆量子化済み残差情報及び幾何情報再構成部2040によって生成された幾何情報を入力とし、RAHT(Region Adaptive Hierarchical Transform)と呼ばれるHaar変換(復号処理においては、逆Haar変換)の一種を用いて、各点の属性情報を復号するように構成されている。RAHTの具体的な処理としては、例えば、非特許文献1に記載の方法を用いることができる。
【0042】
LoD算出部2090は、幾何情報再構成部2040によって生成された幾何情報を入力とし、LoD(Level of Detail)を生成するように構成されている。
【0043】
LoDは、ある点の属性情報から、他のある点の属性情報を予測し、予測残差を符号化或いは復号するといった予測符号化を実現するための参照関係(参照する点及び参照される点)を定義するための情報である。
【0044】
言い換えると、LoDは、幾何情報に含まれる各点を複数のレベルに分類し、下位のレベルに属する点については上位のレベルに属する点の属性情報を用いて属性を符号化或いは復号するといった階層構造を定義した情報である。
【0045】
LoDの具体的な決定方法としては、例えば、上述の非特許文献1に記載の方法を用いてもよい。
【0046】
逆リフティング部2100は、LoD算出部2090によって生成されたLoD及び逆量子化部2070によって生成された逆量子化済み残差情報を用いて、LoDで規定した階層構造に基づいて各点の属性情報を復号するように構成されている。逆リフティングの具体的な処理としては、例えば、上述の非特許文献1に記載の方法を用いることができる。
【0047】
逆色変換部2110は、復号対象の属性情報が色情報であり且つ点群符号化装置100側で色変換が行われていた場合に、RAHT部2080又は逆リフティング部2100から出力される属性情報に逆色変換処理を行うように構成されている。かかる逆色変換処理の実行の有無については、属性情報復号部2060によって復号された制御データによって決定される。
【0048】
点群復号装置200は、以上の処理により、点群内の各点の属性情報を復号して出力するように構成されている。
【0049】
(幾何情報復号部2010)
以下、
図3~
図4を用いて幾何情報復号部2010で復号される制御データについて説明する。
【0050】
図3は、幾何情報復号部2010で受信する符号化データ(ビットストリーム)の構成の一例である。
【0051】
第1に、ビットストリームは、GPS2011を含んでいてもよい。GPS2011は、ジオメトリパラメータセットとも呼ばれ、幾何情報の復号に関する制御データの集合である。具体例については後述する。各GPS2011は、複数のGPS2011が存在する場合に個々を識別するためのGPS id情報を少なくとも含む。
【0052】
第2に、ビットストリームは、GSH2012A/2012Bを含んでいてもよい。GSH2012A/2012Bは、ジオメトリスライスヘッダ或いはジオメトリデータユニットヘッダとも呼ばれ、後述するスライスに対応する制御データの集合である。以降では、スライスという呼称を用いて説明するが、スライスをデータユニットと読み替えることもできる。具体例については後述する。GSH2012A/2012Bは、各GSH2012A/2012Bに対応するGPS2011を指定するためのGPS id情報を少なくとも含む。
【0053】
第3に、ビットストリームは、GSH2012A/2012Bの次に、スライスデータ2013A/2013Bを含んでいてもよい。スライスデータ2013A/2013Bには、幾何情報を符号化したデータが含まれている。スライスデータ2013A/2013Bの一例としては、後述するoccupancy codeやPredicitive codingによる符号化データが挙げられる。
【0054】
以上のように、ビットストリームは、各スライスデータ2013A/2013Bに、1つずつGSH2012A/2012B及びGPS2011が対応する構成となる。
【0055】
上述のように、GSH2012A/2012Bにて、どのGPS2011を参照するかをGPS id情報で指定するため、複数のスライスデータ2013A/2013Bに対して共通のGPS2011を用いることができる。
【0056】
言い換えると、GPS2011は、スライスごとに必ずしも伝送する必要がない。例えば、
図3のように、GSH2012B及びスライスデータ2013Bの直前では、GPS2011を符号化しないようなビットストリームの構成とすることもできる。
【0057】
なお、
図3の構成は、あくまで一例である。各スライスデータ2013A/2013Bに、GSH2012A/2012B及びGPS2011が対応する構成となっていれば、ビットストリームの構成要素として、上述以外の要素が追加されてもよい。
【0058】
例えば、
図3に示すように、ビットストリームは、シーケンスパラメータセット(SPS)2001を含んでいてもよい。また、同様に、伝送に際して、
図3と異なる構成に整形されてもよい。更に、後述する属性情報復号部2060で復号されるビットストリームと合成して単一のビットストリームとして伝送されてもよい。
【0059】
図4は、GPS2011のシンタックス構成の一例である。
【0060】
なお、以下で説明するシンタックス名は、あくまで一例である。以下で説明したシンタックスの機能が同様であれば、シンタックス名は異なっていても差し支えない。
【0061】
GPS2011は、各GPS2011を識別するためのGPS id情報(gps_geom_parameter_set_id)を含んでもよい。
【0062】
なお、
図4のDescriptor欄は、各シンタックスが、どのように符号化されているかを意味している。ue(v)は、符号無し0次指数ゴロム符号であることを意味し、u(1)は、1ビットのフラグであることを意味する。
【0063】
GPS2011は、ツリー合成部2020でインター予測を行うか否かを制御するフラグ(interprediction_enabled_flag)を含んでもよい。
【0064】
例えば、interprediction_enabled_flagの値が「0」の場合は、インター予測を行わないと定義し、interprediction_enabled_flagの値が「1」の場合は、インター予測を行うと定義してもよい。
【0065】
なお、interprediction_enabled_flagは、GPS2011ではなくSPS2001に含まれていてもよい。
【0066】
GPS2011は、ツリー合成部2020でツリータイプを制御するためのフラグ(geom_tree_type)を含んでもよい。例えば、geom_tree_typeの値が「1」の場合は、Predicitive codingを使用すると定義し、geom_tree_typeの値が「0」の場合は、Predicitive codingを使用しないように定義されていてもよい。
【0067】
なお、geom_tree_typeが、GPS2011ではなくSPS2001に含まれていてもよい。
【0068】
GPS2011は、ツリー合成部2020で、Angularモードとして処理を行うかどうかを制御するためのフラグ(geom_angular_enabled)を含んでもよい。
【0069】
例えば、geom_angular_enabledの値が「1」の場合は、AngularモードとしてPredictive codingを行うと定義し、geom_angular_enabledの値が「0」の場合は、AngularモードとしてPredictive codingを行わないように定義されていてもよい。
【0070】
なお、geom_angular_enabledが、GPS2011ではなくSPS2001に含まれていてもよい。
【0071】
GPS2011は、ツリー合成部2020で、Angularモードにおいてセンサータイプを制御するためのフラグ(sensor_type)を含んでもよい。
【0072】
例えば、sensor_typeの値が「1」の場合は、Spinning LiDARデータとして処理するとし、sensor_typeの値が「0」の場合は、Non-spinning LiDARデータとして処理するように定義されていてもよい。
【0073】
なお、sensor_typeは、GPS2011ではなくSPS2001に含まれていてもよい。また、sensor_typeの代わりに、Angularモードにおいて後述する動作モードの切り替えを制御するためのフラグを用いてもよい。
【0074】
GPS2011は、ツリー合成部2020でインター予測のためにグローバル動き補償を行うか否かを制御するフラグ(global_motion_enabled_flag)を含んでもよい。
【0075】
例えば、global_motion_enabled_flagの値が「0」の場合は、グローバル動き補償を行わないと定義し、global_motion_enabled_flagの値が「1」の場合は、グローバル動き補償を行うと定義してもよい。
【0076】
グローバル動き補償を行う場合、各スライスデータには、グローバル動きベクターが含まれていてもよい。
【0077】
なお、global_motion_enabled_flagは、GPS2011ではなくSPS2001に含まれていてもよい。
【0078】
(ツリー合成部2020)
以下、
図5~
図11を用いてツリー合成部2020の処理について説明する。
図5は、ツリー合成部2020における処理の一例を示すフローチャートである。なお、以下では「Predictive geometry coding」を使用してツリーを合成する場合の例について説明する。
【0079】
なお、「Predictive cording」の代わりに「Predictive geometry」、「Predictive geometry coding」、「Predictive tree」等の呼称が用いられる場合もある。
【0080】
図5に示すように、ステップS501において、ツリー合成部2020は、interprediction_enabled_flagの値に基づき、インター予測を使用するかどうかを判定する。
【0081】
ツリー合成部2020は、インター予測を使用すると判定した場合、ステップS502へ進み、インター予測を使用しないと判定した場合、ステップS505へ進む。
【0082】
ステップS502において、ツリー合成部2020は、フレームバッファ2120から参照フレームを取得する。フレームバッファ2120には、以前に復号したフレームが1つ記憶されているとしてもよく、復号したフレームのフレームバッファ2020へのフレームの追加は、1つ或いは規定数のフレームの復号が完了する毎に行われるとしてもよい。ツリー合成部2020は、参照フレームを取得した後、ステップS503に進む。
【0083】
ステップS503において、ツリー合成部2020は、global_motion_enabled_flagに基づき、グローバル動き補償を行うかどうかを判定する。
【0084】
ツリー合成部2020は、グローバル動き補償を行うと判定した場合、ステップS504へ進み、グローバル動き補償を行わないと判定した場合、ステップS505へ進む。
【0085】
ステップS504において、ツリー合成部2020は、ステップS502で取得した参照フレームに対してグローバル動き補償を行う。
【0086】
ここで、グローバル動き補償は、フレームごとの大域的な位置ずれを補正する処理であり、参照フレームの全て或いは指定範囲内の点群に対して、幾何情報復号部2010で復号したグローバル動きベクターに基づく回転・平行移動を適用する処理である。
【0087】
ツリー合成部2020は、グローバル動き補償を行った後、ステップS505に進む。
【0088】
ステップS505において、ツリー合成部2020は、スライスデータの復号を行う。ステップS505の具体的な処理は、後述する。ツリー合成部2020は、スライスデータを復号した後、ステップS506へ進む。
【0089】
ステップS506において、ツリー合成部2020は、処理を終了する。なお、ステップS503及びステップS504の処理、つまり、グローバル動き補償の判定及び実行は、ステップS505のスライスデータの復号処理の中で行われてもよい。
【0090】
図6は、ステップS505におけるスライスデータの復号処理の一例を示すフローチャートである。
【0091】
図6に示すように、ステップS601において、ツリー合成部2020は、スライスデータに対応する予測木の構築を行う。
【0092】
スライスデータには、予測木の各ノードの子ノードの数が深さ優先順に並んだリストが含まれていてもよい。予測木を構築する方法としては、ルートノードから開始して、深さ優先順で、各ノードに、上述のリストで指定された数の子ノードを追加する方法を採ってもよい。
【0093】
ツリー合成部2020は、予測木の構築を完了した後、ステップS602へ進む。
【0094】
ステップS602において、ツリー合成部2020は、予測木の全ノードの処理が完了したかどうかを判定する。
【0095】
ツリー合成部2020は、予測木の全ノードの処理が完了していると判定した場合、ステップS607へ進み、予測木の全ノードの処理が完了していないと判定した場合、ステップS603へ進む。
【0096】
ステップS603において、ツリー合成部2020は、予測木から処理対象ノードを選択する。
【0097】
ツリー合成部2020は、処理対象ノードとして、深さ優先順で前回の処理対象ノードの次にあたるノードを選択してもよい。
【0098】
ツリー合成部2020は、処理対象ノードの選択が完了した後、ステップS604へ進む。
【0099】
ステップS604において、ツリー合成部2020は、処理対象ノードに対応する点の座標を予測する。かかる座標の予測の具体的な方法は、後述する。
【0100】
ツリー合成部2020は、かかる予測が完了した後、ステップS605へ進む。
【0101】
ステップS605において、ツリー合成部2020は、処理対象ノードに対応する点の座標の予測残差を復号する。スライスデータには、各ノードに対応する点の座標の予測残差が含まれていてもよい。
【0102】
ツリー合成部2020は、処理対象ノードの予測残差の復号が完了した後、ステップS606へ進む。
【0103】
ステップS606において、ツリー合成部2020は、処理対象ノードに対応する点の座標を再構成する。ツリー合成部2020は、点の座標について、ステップS604において予測された座標及びステップS605において復号された残差の和によって求めてもよい。
【0104】
ツリー合成部2020は、座標の再構成が完了した後、ステップ602に戻る。
【0105】
ステップS607において、ツリー合成部2020は、ステップS505の処理を終了する。
【0106】
ここで、ステップS604及びステップS605の順序は、入れ替わってもよい。
【0107】
ツリー合成部2020は、Angularモードが使用されている場合は、ステップS604~ステップS606で扱う座標値が座標変換後の値であることを考慮してもよく、ステップS606では、その逆変換の処理を含んでいてもよい。
【0108】
図7は、座標変換の1つである極座標系への変換処理の一例を説明するための図である。
図7に示すように、各点の座標値は、半径r、仰角θ、方位角φで表される。
【0109】
また、極座標変換後の座標値のうち、仰角θ及び方位角φに対してさらに適当な変換が行われていてもよい。例えば、仰角θ及び方位角φの2値を2次元直交座標に見立てて、さらに2次元極座標変換が加えられてもよい。
【0110】
図8Aは、センサータイプを制御するフラグがSpinning LiDARデータを示す場合の処理の一例を説明するための図であり、
図8Bは、センサータイプを制御するフラグがNon-spinning LiDARデータを示す場合の処理の一例について説明するための図である。
【0111】
図8Aに示すように、センサータイプがSpinning LiDARを示す場合、ツリー合成部2020は、ステップS604及びステップS605において、座標値のうち半径r及び方位角φについてのみ処理を行い、ステップS606において、半径r及び方位角φの再構成を行うと共に、仰角θについては事前に定義される固定値から設定してもよい。
【0112】
例えば、ツリー合成部2020は、仰角θについては、LiDAR内の複数のレーザーのうちの1つの仰角を設定するとしてもよく、いずれのレーザーかを示すレーザーIDがスライスデータに含まれていてもよい。
【0113】
一方、センサータイプがNon-Spinning LiDARを示す場合、ツリー合成部2020は、ステップS604~ステップS606において、座標値のr、θ、φの全てについて、予測、残差復号及び座標再構成の処理を行ってもよい。
【0114】
r、θ、φの予測、残差復号及び座標再構成に用いられるパラメータは、それぞれ個別に設定されているとしてもよく、共通で設定されているとしてもよい。ここで、パラメータには、例えば、θ及びφの角度(ラジアン)を整数値で表現するためにスケールアップする際のスケール値や、θやφの値を量子化するための量子化ステップ幅等がある。これらのパラメータは、GPS2011或いはSPS2001のヘッダ情報に含まれているとしてもよい。
【0115】
なお、ツリー合成部2020は、センサータイプを制御するフラグではなく、仰角成分の予測及び残差復号を有効にするか否かを制御するフラグの値に基づいて、上述の2つの動作を切り替えてもよい。
【0116】
図9は、ステップS604における予測の方法の一例について説明するための図である。
【0117】
ツリー合成部2020は、ステップS604において、
図9に示すように、連続するN点のうち1点のみで予測を行うとしてもよい。そして、ツリー合成部2020は、その1点の予測値を残りのN-1点の予測値として共有してもよい。
【0118】
図10は、ステップS604における座標予測の処理の一例を示すフローチャートである。
【0119】
図10に示すように、ステップS1001において、ツリー合成部2020は、予測器フラグを復号する。
【0120】
ここで、スライスデータには、各ノードについて使用する予測器を示すフラグが含まれていてもよい。例えば、スライスデータには、インター予測器かイントラ予測器かを示すフラグや、インター予測器のインデックス等、非特許文献1及び2に記載の内容と同様のフラグが含まれていてもよい。また、スライスデータには、後述するその他のフラグが含まれていてもよい。
【0121】
ツリー合成部2020は、かかる予測器フラグを復号した後、ステップS1002へ進む。
【0122】
ステップS1002において、ツリー合成部2020は、ステップS1001で復号された予測器フラグに基づき、インター予測器を使用するかどうかについて判定する。
【0123】
ツリー合成部2020は、インター予測器を使用すると判定した場合、ステップS1004へ進み、インター予測器を使用しないと判定した場合、ステップS1003へ進む。
【0124】
ステップS1003において、ツリー合成部2020は、処理対象ノードの座標についてイントラ予測を行う。
【0125】
ツリー合成部2020は、イントラ予測を行う場合、処理対象ノードの親ノード或いは祖先ノード(例えば、親ノードの親ノード等)の座標に基づいて予測器を構成し、処理対象ノードの座標を予測する。
【0126】
ツリー合成部2020は、イントラ予測器の構成方法について、非特許文献1及び2に記載の方法を用いてよく、複数あるイントラ予測器のうちステップS1001で復号された予測器フラグが示す予測器を使用してもよい。
【0127】
ツリー合成部2020は、イントラ予測が完了した後、ステップS1005へ進む。
【0128】
ステップS1004において、ツリー合成部2020は、処理対象ノードの座標についてインター予測を行う。
【0129】
ツリー合成部2020は、インター予測を行う場合、参照フレームから処理対象ノードに対応するノードを予測器として選出し、選出された予測器の座標を処理対象ノードの座標の予測値とする。
【0130】
ツリー合成部2020は、Angularモードにおいて、センサータイプがSpinning LiDARを示す場合或いは仰角成分の予測及び残差復号が無効な場合、非特許文献2と同様の方法を用いて、参照フレームから予測器を選出してもよい。
【0131】
また、ツリー合成部2020は、Angularモードにおいて、センサータイプがNon-Spinning LiDARを示す場合或いは仰角成分の予測及び残差復号が有効な場合、後述するように、参照フレームから予測器を選出する。
【0132】
ツリー合成部2020は、インター予測が完了した後、ステップS1005へ進む。
【0133】
ステップS1005において、ツリー合成部2020は、ステップS604の処理を終了する。
【0134】
図11及び
図12は、上述のステップS1004において、Angularモードにおいて、センサータイプがNon-Spinning LiDARを示す場合或いは仰角成分の予測及び残差復号が有効な場合に、参照フレームから予測器を選出する処理の一例について説明するための図である。
【0135】
図11は、処理対象ノードの親ノードに対して、参照フレームのノードのうち座標値θ、φが最も近いノードを探し、その子ノードや孫ノードから予測器を選出する例を示す。
【0136】
図12は、各ノードがフレーム内で固有のノードIDを有するとし、処理対象ノードのノードIDに基づき参照フレームから予測器を選出する例を示す。
【0137】
ツリー合成部2020は、Angularモードにおいて、センサータイプがNon-Spinning LiDARを示す場合或いは仰角成分の予測及び残差復号が有効な場合に、予測木は、根からN本の直列の枝がつながるように構成されているとし、各ノードは、所属する枝を示す枝IDを保持するものとしてもよい。
【0138】
ツリー合成部2020は、処理対象ノードの親ノードの枝IDにより、参照フレームから予測器を探す範囲を限定してもよい。
【0139】
上述のように、本実施形態では、ツリー合成部2020は、Predictive codingのAngularモードにおいて、センサータイプ或いは動作モードによって異なる処理をするように構成されている。
【0140】
また、ツリー合成部2020は、Angularモードにおいて、センサータイプがNon-Spinning LiDARデータを示す場合或いは動作モードが仰角成分の予測及び残差復号の有効化を示す場合、極座標変換後の座標値r、θ、φのそれぞれについて、予測、残差復号及び座標再構成の処理を行うように構成されていてもよい。
【0141】
また、ツリー合成部2020は、Angularモードにおいて、センサータイプがNon-Spinning LiDARデータを示す場合或いは前記動作モードが仰角成分の予測及び残差復号の有効化を示す場合に、極座標変換後の座標値r、θ、φのうちのθ、φに座標変換を適用した後の座標値r、θ、φのそれぞれについて、予測、残差復号及び座標再構成の処理を行うように構成されていてもよい。
【0142】
また、ツリー合成部2020は、Angularモードにおいて、センサータイプがNon-Spinning LiDARデータを示す場合或いは動作モードが仰角成分の予測及び残差復号の有効化を示す場合に、複数の点のうちの1点で予測を行い、他の点との共通の予測値として扱うように構成されていてもよい。
【0143】
また、ツリー合成部2020は、Angularモードにおいて、センサータイプがNon-Spinning LiDARデータを示す場合或いは動作モードが仰角成分の予測及び残差復号の有効化を示す場合に、インター予測で、参照フレームから極座標変換後の座標値θとφの値に基づいて予測器を選出するように構成されていてもよい。
【0144】
また、ツリー合成部2020は、Angularモードにおいて、センサータイプがNon-Spinning LiDARデータを示す場合或いは動作モードが仰角成分の予測及び残差復号の有効化を示す場合に、インター予測で、参照フレームからノードIDに基づいて予測器を選出するように構成されていてもよい。
【0145】
さらにツリー合成部2020は、Angularモードにおいて、センサータイプがNon-Spinning LiDARデータを示す場合或いは動作モードが仰角成分の予測及び残差復号の有効化を示す場合に、インター予測で、参照フレームの予測木の枝IDに基づいて予測器を選出するように構成されていてもよい。
【0146】
(点群符号化装置100)
以下、
図13を参照して、本実施形態に係る点群符号化装置100について説明する。
図13は、本実施形態に係る点群符号化装置100の機能ブロックの一例について示す図である。
【0147】
図13に示すように、点群符号化装置100は、座標変換部1010と、幾何情報量子化部1020と、ツリー解析部1030と、近似表面解析部1040と、幾何情報符号化部1050と、幾何情報再構成部1060と、色変換部1070と、属性転移部1080と、RAHT部1090と、LoD算出部1100と、リフティング部1110と、属性情報量子化部1120と、属性情報符号化部1130と、フレームバッファ1140とを有する。
【0148】
座標変換部1010は、入力点群の3次元座標系から、任意の異なる座標系への変換処理を行うよう構成されている。座標変換は、例えば、入力点群を回転することにより、入力点群のx、y、z座標を任意のs、t、u座標に変換してもよい。また、変換のバリエーションの1つとして、入力点群の座標系をそのまま使用してもよい。
【0149】
幾何情報量子化部1020は、座標変換後の入力点群の位置情報の量子化及び座標が重複する点の除去を行うように構成されている。なお、量子化ステップサイズが1の場合は、入力点群の位置情報と量子化後の位置情報とが一致する。すなわち、量子化ステップサイズが1の場合は、量子化を行わない場合と等価になる。
【0150】
ツリー解析部1030は、量子化後の点群の位置情報を入力として、後述のツリー構造に基づいて、符号化対象空間のどのノードに点が存在するかについて示すoccupancy codeを生成するように構成されている。
【0151】
ツリー解析部1030は、本処理において、符号化対象空間を再帰的に直方体で区切ることにより、ツリー構造を生成するように構成されている。
【0152】
ここで、ある直方体内に点が存在する場合、かかる直方体を複数の直方体に分割する処理を、直方体が所定のサイズになるまで再帰的に実行することでツリー構造を生成することができる。なお、かかる各直方体をノードと呼ぶ。また、ノードを分割して生成される各直方体を子ノードと呼び、子ノード内に点が含まれるか否かについて0又は1で表現したものがoccupancy codeである。
【0153】
以上のように、ツリー解析部1030は、所定のサイズになるまでノードを再帰的に分割しながら、occupancy codeを生成するように構成されている。
【0154】
本実施形態では、上述の直方体を常に立方体として8分木分割を再帰的に行う「Octree」と呼ばれる手法、及び、8分木分割に加え、4分木分割及び2分木分割を行う「QtBt」と呼ばれる手法を使用することができる。
【0155】
ここで、「QtBt」を使用するか否かについては、制御データとして点群復号装置200に伝送される。
【0156】
或いは、任意のツリー構成を用いるPredictive codingを使用するように指定されてもよい。かかる場合、ツリー解析部1030が、ツリー構造を決定し、決定されたツリー構造は、制御データとして点群復号装置200へ伝送される。
【0157】
例えば、ツリー構造の制御データは、
図5~
図12で説明した手順で復号できるよう構成されていてもよい。
【0158】
近似表面解析部1040は、ツリー解析部1030によって生成されたツリー情報を用いて、近似表面情報を生成するように構成されている。
【0159】
近似表面情報は、例えば、物体の3次元点群データを復号する際等において、点群が物体表面に密に分布しているような場合に、個々の点群を復号するのではなく、点群の存在領域を小さな平面で近似して表現したものである。
【0160】
具体的には、近似表面解析部1040は、例えば、「Trisoup」と呼ばれる手法で、近似表面情報を生成するように構成されていてもよい。また、Lidar等で取得した疎な点群を復号する場合は、本処理を省略することができる。
【0161】
幾何情報符号化部1050は、ツリー解析部1030によって生成されたoccupancy code及び近似表面解析部1040によって生成された近似表面情報等のシンタックスを符号化してビットストリーム(幾何情報ビットストリーム)を生成するように構成されている。ここで、ビットストリームには、例えば、
図4で説明したシンタックスが含まれていてもよい。
【0162】
符号化処理は、例えば、コンテクスト適応二値算術符号化処理である。ここで、例えば、シンタックスは、位置情報の復号処理を制御するための制御データ(フラグやパラメータ)を含む。
【0163】
幾何情報再構成部1060は、ツリー解析部1030によって生成されたツリー情報及び近似表面解析部1040によって生成された近似表面情報に基づいて、符号化対象の点群データの各点の幾何情報(符号化処理が仮定している座標系、すなわち、座標変換部1010における座標変換後の位置情報)を再構成するように構成されている。
【0164】
フレームバッファ1140は、幾何情報再構成部1060によって再構成された幾何情報を入力とし、参照フレームとして保存するように構成されている。
【0165】
保存された参照フレームは、ツリー解析部1030においてインター予測を行う場合に、フレームバッファ1140から読み出されて参照フレームとして使用される。
【0166】
色変換部1070は、入力の属性情報が色情報であった場合に、色変換を行うように構成されている。色変換は、必ずしも実行する必要は無く、色変換処理の実行の有無については、制御データの一部として符号化され、点群復号装置200へ伝送される。
【0167】
属性転移部1080は、入力点群の位置情報、幾何情報再構成部1060における再構成後の点群の位置情報及び色変換部1070での色変化後の属性情報に基づいて、属性情報の歪みが最小となるように属性値を補正するように構成されている。具体的な補正方法は、例えば、非特許文献2に記載の方法を適用できる。
【0168】
RAHT部1090は、属性転移部1080による転移後の属性情報及び幾何情報再構成部1060によって生成された幾何情報を入力とし、RAHT(Region Adaptive Hierarchical Transform)と呼ばれるHaar変換の一種を用いて、各点の残差情報を生成するように構成されている。RAHTの具体的な処理としては、例えば、上述の非特許文献2に記載の方法を用いることができる。
【0169】
LoD算出部1100は、幾何情報再構成部1060によって生成された幾何情報を入力とし、LoD(Level of Detail)を生成するように構成されている。
【0170】
LoDは、ある点の属性情報から、他のある点の属性情報を予測し、予測残差を符号化或いは復号するといった予測符号化を実現するための参照関係(参照する点及び参照される点)を定義するための情報である。
【0171】
言い換えると、LoDは、幾何情報に含まれる各点を複数のレベルに分類し、下位のレベルに属する点については上位のレベルに属する点の属性情報を用いて属性を符号化或いは復号するといった階層構造を定義した情報である。
【0172】
LoDの具体的な決定方法としては、例えば、上述の非特許文献2に記載の方法を用いてもよい。
【0173】
リフティング部1110は、LoD算出部1100によって生成されたLoD及び属性転移部1080での属性転移後の属性情報を用いて、リフティング処理により残差情報を生成するように構成されている。
【0174】
リフティングの具体的な処理としては、例えば、上述の非特許文献2に記載の方法を用いてもよい。
【0175】
属性情報量子化部1120は、RAHT部1090又はリフティング部1110から出力される残差情報を量子化するように構成されている。ここで、量子化ステップサイズが1の場合は、量子化を行わない場合と等価である。
【0176】
属性情報符号化部1130は、属性情報量子化部1120から出力される量子化後の残差情報等をシンタックスとして符号化処理を行い、属性情報に関するビットストリーム(属性情報ビットストリーム)を生成するように構成されている。
【0177】
符号化処理は、例えば、コンテクスト適応二値算術符号化処理である。ここで、例えば、シンタックスは、属性情報の復号処理を制御するための制御データ(フラグ及びパラメータ)を含む。
【0178】
点群符号化装置100は、以上の処理により、点群内の各点の位置情報及び属性情報を入力として符号化処理を行い、幾何情報ビットストリーム及び属性情報ビットストリームを出力するように構成されている。
【0179】
また、上述の点群符号化装置100及び点群復号装置200は、コンピュータに各機能(各工程)を実行させるプログラムであって実現されていてもよい。
【0180】
なお、上記の各実施形態では、本発明を点群符号化装置100及び点群復号装置200への適用を例にして説明したが、本発明は、かかる例のみに限定されるものではなく、点群符号化装置100及び点群復号装置200の各機能を備えた点群符号化/復号システムにも同様に適用できる。
【産業上の利用可能性】
【0181】
なお、本実施形態によれば、例えば、動画像通信において総合的なサービス品質の向上を実現できることから、国連が主導する持続可能な開発目標(SDGs)の目標9「レジリエントなインフラを整備し、持続可能な産業化を推進するとともに、イノベーションの拡大を図る」に貢献することが可能となる。
【符号の説明】
【0182】
10…点群処理システム
100…点群符号化装置
1010…座標変換部
1020…幾何情報量子化部
1030…ツリー解析部
1040…近似表面解析部
1050…幾何情報符号化部
1060…幾何情報再構成部
1070…色変換部
1080…属性転移部
1090…RAHT部
1100…LoD算出部
1110…リフティング部
1120…属性情報量子化部
1130…属性情報符号化部
1140…フレームバッファ
200…点群復号装置
2010…幾何情報復号部
2020…ツリー合成部
2030…近似表面合成部
2040…幾何情報再構成部
2050…逆座標変換部
2060…属性情報復号部
2070…逆量子化部
2080…RAHT部
2090…LoD算出部
2100…逆リフティング部
2110…逆色変換部
2120…フレームバッファ