(19)【発行国】日本国特許庁(JP)
(12)【公報種別】公開特許公報(A)
(11)【公開番号】P2024152169
(43)【公開日】2024-10-25
(54)【発明の名称】点群復号装置、点群復号方法及びプログラム
(51)【国際特許分類】
G06T 9/40 20060101AFI20241018BHJP
【FI】
G06T9/40
【審査請求】未請求
【請求項の数】6
【出願形態】OL
(21)【出願番号】P 2023066204
(22)【出願日】2023-04-14
【国等の委託研究の成果に係る記載事項】(出願人による申告)令和5年度、総務省、「3次元空間データの無線伝送に向けた高能率圧縮技術の研究開発」、産業技術力強化法第17条の適用を受ける特許出願
(71)【出願人】
【識別番号】000208891
【氏名又は名称】KDDI株式会社
(74)【代理人】
【識別番号】110001564
【氏名又は名称】フェリシテ弁理士法人
(72)【発明者】
【氏名】中塚 智尋
(72)【発明者】
【氏名】海野 恭平
(72)【発明者】
【氏名】小森田 賢史
(57)【要約】
【課題】符号化の圧縮性能を向上させること。
【解決手段】本発明に係る点群復号装置200は、Predictive codingにおいて、処理対象ノードの親ノードのレーザID及び方位角からオフセット値を引いた方位角に基づいてインター予測器を選出する場合に、事前に定義したオフセット値の第1候補中から、所定方法で、第2候補を選出し、第2候補の中から前記オフセット値を特定するツリー合成部2020を備える。
【選択図】
図2
【特許請求の範囲】
【請求項1】
点群復号装置であって、
Predictive codingにおいて、処理対象ノードの親ノードのレーザID及び方位角からオフセット値を引いた方位角に基づいてインター予測器を選出する場合に、事前に定義したオフセット値の第1候補中から、所定方法で、第2候補を選出し、前記第2候補の中から前記オフセット値を特定するツリー合成部を備えることを特徴とする点群復号装置。
【請求項2】
前記ツリー合成部は、前記所定方法として、直前に処理したノードのオフセット値に基づいて前記第2候補を選出することを特徴とする請求項1に記載の点群復号装置。
【請求項3】
前記ツリー合成部は、前記所定方法として、処理対象フレームのグローバル動きベクトルの大きさに基づいて、前記第2候補を選出することを特徴とする請求項1に記載の点群復号装置。
【請求項4】
前記ツリー合成部は、前記第2候補が1つに絞り込まれた場合に、前記オフセット値を示すデータの復号をスキップすることを特徴とする請求項1~3のいずれか一項に記載の点群復号装置。
【請求項5】
点群復号方法であって、
Predictive codingにおいて、処理対象ノードの親ノードのレーザID及び方位角からオフセット値を引いた方位角に基づいてインター予測器を選出する場合に、事前に定義したオフセット値の第1候補中から、所定方法で、第2候補を選出し、前記第2候補の中から前記オフセット値を特定する工程を有することを特徴とする点群復号方法。
【請求項6】
コンピュータを、点群復号装置として機能させるプログラムであって、
前記点群復号装置は、
Predictive codingにおいて、処理対象ノードの親ノードのレーザID及び方位角からオフセット値を引いた方位角に基づいてインター予測器を選出する場合に、事前に定義したオフセット値の第1候補中から、所定方法で、第2候補を選出し、前記第2候補の中から前記オフセット値を特定するツリー合成部を備えることを特徴とするプログラム。
【発明の詳細な説明】
【技術分野】
【0001】
本発明は、点群復号装置、点群復号方法及びプログラムに関する。
【背景技術】
【0002】
非特許文献1には、Predictive codingにおいてイントラ予測を行う技術が開示されている。
【0003】
また、非特許文献2では、Predictive cordingにおいて、参照フレームから選出したインター予測器を用いてインター予測を行う技術が開示されている。
【先行技術文献】
【非特許文献】
【0004】
【非特許文献1】G-PCC codec description、ISO/IEC JTC1/SC29/WG7 N00271
【非特許文献2】G-PCC 2nd Edition codec description、ISO/IEC JTC1/SC29/WG7 N00314
【発明の概要】
【発明が解決しようとする課題】
【0005】
しかしながら、非特許文献1の方法では、イントラ予測のみ行うため、非均一なシーンでは予測残差が大きくなり、圧縮性能が損なわれることがあるという問題点があった。
【0006】
また、非特許文献2の方法では、イントラ予測の他にインター予測を行うが、直前に復号した点のレーザID及び方位角を基準に参照フレームの点からインター予測器を選出するため、復号対象フレームと参照フレームとの間の位置ずれが大きいと適切な予測器を選択できず、圧縮性能が損なわれることがあるという問題点があった。
【0007】
そこで、本発明は、上述の課題に鑑みてなされたものであり、符号化の圧縮性能を向上させることができる点群復号装置、点群復号方法及びプログラムを提供することを目的とする。
【課題を解決するための手段】
【0008】
本発明の第1の特徴は、点群復号装置であって、Predictive codingにおいて、処理対象ノードの親ノードのレーザID及び方位角からオフセット値を引いた方位角に基づいてインター予測器を選出する場合に、事前に定義したオフセット値の第1候補中から、所定方法で、第2候補を選出し、前記第2候補の中から前記オフセット値を特定するツリー合成部を備えることを要旨とする
本発明の第2の特徴は、点群復号方法であって、Predictive codingにおいて、処理対象ノードの親ノードのレーザID及び方位角からオフセット値を引いた方位角に基づいてインター予測器を選出する場合に、事前に定義したオフセット値の第1候補中から、所定方法で、第2候補を選出し、前記第2候補の中から前記オフセット値を特定する工程を有することを要旨とする。
【0009】
本発明の第3の特徴は、コンピュータを、点群復号装置として機能させるプログラムであって、前記点群復号装置は、Predictive codingにおいて、処理対象ノードの親ノードのレーザID及び方位角からオフセット値を引いた方位角に基づいてインター予測器を選出する場合に、事前に定義したオフセット値の第1候補中から、所定方法で、第2候補を選出し、前記第2候補の中から前記オフセット値を特定するツリー合成部を備えることを要旨とする。
【発明の効果】
【0010】
本発明によれば、符号化の圧縮性能を向上させることができる点群復号装置、点群復号方法及びプログラムを提供することができる。
【図面の簡単な説明】
【0011】
【
図1】
図1は、一実施形態に係る点群処理システム10の構成の一例を示す図である。
【
図2】
図2は、一実施形態に係る点群復号装置200の機能ブロックの一例を示す図である。
【
図3】
図3は、一実施形態に係る点群復号装置200の幾何情報復号部2010で受信する符号化データ(ビットストリーム)の構成の一例を示す図である。
【
図4】
図4は、GPS2011のシンタックス構成の一例を示す図である。
【
図5】
図5は、一実施形態に係る点群復号装置200のツリー合成部2020における処理の一例を示すフローチャートである。
【
図6】
図6は、ステップS505におけるスライスデータの復号処理の一例を示すフローチャートである。
【
図7】
図7は、ステップS604における座標予測の処理の一例を示すフローチャートである。
【
図8】
図8は、ステップS704において、参照フレームから予測器を選出する処理の一例を示す図である。
【
図9】
図9は、ステップS704において、参照フレームから予測器を選出する処理の一例を示す図である。
【
図10】
図10は、本実施形態に係る点群符号化装置100の機能ブロックの一例について示す図である。
【発明を実施するための形態】
【0012】
以下、本発明の実施の形態について、図面を参照しながら説明する。なお、以下の実施形態における構成要素は、適宜、既存の構成要素等との置き換えが可能であり、また、他の既存の構成要素との組み合わせを含む様々なバリエーションが可能である。したがって、以下の実施形態の記載をもって、特許請求の範囲に記載された発明の内容を限定するものではない。
【0013】
(第1実施形態)
以下、
図1~
図10を参照して、本発明の第1実施形態に係る点群処理システム10について説明する。
図1は、本実施形態に係る実施形態に係る点群処理システム10を示す図である。
【0014】
図1に示すように、点群処理システム10は、点群符号化装置100及び点群復号装置200を有する。
【0015】
点群符号化装置100は、入力点群信号を符号化することによって符号化データ(ビットストリーム)を生成するように構成されている。点群復号装置200は、ビットストリームを復号することによって出力点群信号を生成するように構成されている。
【0016】
なお、入力点群信号及び出力点群信号は、点群内の各点の位置情報と属性情報とから構成される。属性情報は、例えば、各点の色情報や反射率である。
【0017】
ここで、かかるビットストリームは、点群符号化装置100から点群復号装置200に対して伝送路を介して送信されてもよい。また、ビットストリームは、記憶媒体に格納された上で、点群符号化装置100から点群復号装置200に提供されてもよい。
【0018】
(点群復号装置200)
以下、
図2を参照して、本実施形態に係る点群復号装置200について説明する。
図2は、本実施形態に係る点群復号装置200の機能ブロックの一例について示す図である。
【0019】
図2に示すように、点群復号装置200は、幾何情報復号部2010と、ツリー合成部2020と、近似表面合成部2030と、幾何情報再構成部2040と、逆座標変換部2050と、属性情報復号部2060と、逆量子化部2070と、RAHT部2080と、LoD算出部2090と、逆リフティング部2100と、逆色変換部2110と、フレームバッファ2120とを有する。
【0020】
幾何情報復号部2010は、点群符号化装置100から出力されるビットストリームのうち、幾何情報に関するビットストリーム(幾何情報ビットストリーム)を入力とし、シンタックスを復号するように構成されている。
【0021】
復号処理は、例えば、コンテクスト適応二値算術復号処理である。ここで、例えば、シンタックスは、位置情報の復号処理を制御するための制御データ(フラグやパラメータ)を含む。
【0022】
ツリー合成部2020は、幾何情報復号部2010によって復号された制御データ及び後述するツリー内のどのノードに点群が存在するかを示すoccupancy codeを入力として、復号対象空間内のどの領域に点が存在するかというツリー情報を生成するように構成されている。
【0023】
なお、occupancy codeの復号処理をツリー合成部2020内部で行うよう構成されていてもよい。
【0024】
本処理は、復号対象空間を直方体で区切り、occupancy codeを参照して各直方体内に点が存在するかを判断し、点が存在する直方体を複数の直方体に分割し、occupancy codeを参照するという処理を再帰的に繰り返すことで、ツリー情報を生成することができる。
【0025】
ここで、かかるoccupancy codeの復号に際して、後述するインター予測を用いてもよい。
【0026】
本実施形態では、上述の直方体を常に立方体として8分木分割を再帰的に行う「Octree」と呼ばれる手法、及び、8分木分割に加え、4分木分割及び2分木分割を行う「QtBt」と呼ばれる手法を使用することができる。QtBt」を使用するか否かは、制御データとして点群符号化装置100側から伝送される。
【0027】
或いは、制御データによってPredictive geometry codingを使用するように指定された場合、ツリー合成部2020は、点群符号化装置100において決定した任意のツリー構成に基づいて各点の座標を復号するように構成されている。
【0028】
近似表面合成部2030は、ツリー合成部2020によって生成されたツリー情報を用いて近似表面情報を生成し、かかる近似表面情報に基づいて点群を復号するように構成されている。
【0029】
近似表面情報は、例えば、物体の3次元点群データを復号する際等において、点群が物体表面に密に分布しているような場合に、個々の点群を復号するのではなく、点群の存在領域を小さな平面で近似して表現したものである。
【0030】
具体的には、近似表面合成部2030は、例えば、「Trisoup」と呼ばれる手法で、近似表面情報を生成し、点群を復号することができる。「Trisoup」の具体的な処理例については後述する。また、Lidar等で取得した疎な点群を復号する場合は、本処理を省略することができる。
【0031】
幾何情報再構成部2040は、ツリー合成部2020によって生成されたツリー情報及び近似表面合成部2030によって生成された近似表面情報を元に、復号対象の点群データの各点の幾何情報(復号処理が仮定している座標系における位置情報)を再構成するように構成されている。
【0032】
逆座標変換部2050は、幾何情報再構成部2040によって再構成された幾何情報を入力として、復号処理が仮定している座標系から、出力点群信号の座標系に変換を行い、位置情報を出力するように構成されている。
【0033】
フレームバッファ2120は、幾何情報再構成部2040によって再構成された幾何情報を入力として、参照フレームとして保存するように構成されている。保存した参照フレームは、ツリー合成部2020において時間的に異なるフレームのインター予測を行う場合に、フレームバッファ2130から読み出されて参照フレームとして使用される。
【0034】
ここで、各フレームに対してどの時刻の参照フレームを用いるかどうかは、例えば、点群符号化装置100からビットストリームとして伝送されてくる制御データに基づいて決定されてもよい。
【0035】
属性情報復号部2060は、点群符号化装置100から出力されるビットストリームのうち、属性情報に関するビットストリーム(属性情報ビットストリーム)を入力とし、シンタックスを復号するように構成されている。
【0036】
復号処理は、例えば、コンテクスト適応二値算術復号処理である。ここで、例えば、シンタックスは、属性情報の復号処理を制御するための制御データ(フラグ及びパラメータ)を含む。
【0037】
また、属性情報復号部2060は、復号したシンタックスから、量子化済み残差情報を復号するように構成されている。
【0038】
逆量子化部2070は、属性情報復号部2060によって復号された量子化済み残差情報と、属性情報復号部2060によって復号された制御データの一つである量子化パラメータとを元に、逆量子化処理を行い、逆量子化済み残差情報を生成するように構成されている。
【0039】
逆量子化済み残差情報は、復号対象の点群の特徴に応じて、RAHT部2080及びLoD算出部2090のいずれかに出力される。いずれに出力されるかは、属性情報復号部2060によって復号される制御データによって指定される。
【0040】
RAHT部2080は、逆量子化部2070によって生成された逆量子化済み残差情報及び幾何情報再構成部2040によって生成された幾何情報を入力とし、RAHT(Region Adaptive Hierarchical Transform)と呼ばれるHaar変換(復号処理においては、逆Haar変換)の一種を用いて、各点の属性情報を復号するように構成されている。RAHTの具体的な処理としては、例えば、非特許文献1に記載の方法を用いることができる。
【0041】
LoD算出部2090は、幾何情報再構成部2040によって生成された幾何情報を入力とし、LoD(Level of Detail)を生成するように構成されている。
【0042】
LoDは、ある点の属性情報から、他のある点の属性情報を予測し、予測残差を符号化或いは復号するといった予測符号化を実現するための参照関係(参照する点及び参照される点)を定義するための情報である。
【0043】
言い換えると、LoDは、幾何情報に含まれる各点を複数のレベルに分類し、下位のレベルに属する点については上位のレベルに属する点の属性情報を用いて属性を符号化或いは復号するといった階層構造を定義した情報である。
【0044】
LoDの具体的な決定方法としては、例えば、上述の非特許文献1に記載の方法を用いてもよい。
【0045】
逆リフティング部2100は、LoD算出部2090によって生成されたLoD及び逆量子化部2070によって生成された逆量子化済み残差情報を用いて、LoDで規定した階層構造に基づいて各点の属性情報を復号するように構成されている。逆リフティングの具体的な処理としては、例えば、上述の非特許文献1に記載の方法を用いることができる。
【0046】
逆色変換部2110は、復号対象の属性情報が色情報であり且つ点群符号化装置100側で色変換が行われていた場合に、RAHT部2080又は逆リフティング部2100から出力される属性情報に逆色変換処理を行うように構成されている。かかる逆色変換処理の実行の有無については、属性情報復号部2060によって復号された制御データによって決定される。
【0047】
点群復号装置200は、以上の処理により、点群内の各点の属性情報を復号して出力するように構成されている。
【0048】
(幾何情報復号部2010)
以下、
図3~
図4を用いて幾何情報復号部2010で復号される制御データについて説明する。
【0049】
図3は、幾何情報復号部2010で受信する符号化データ(ビットストリーム)の構成の一例である。
【0050】
第1に、ビットストリームは、GPS2011を含んでいてもよい。GPS2011は、ジオメトリパラメータセットとも呼ばれ、幾何情報の復号に関する制御データの集合である。具体例については後述する。各GPS2011は、複数のGPS2011が存在する場合に個々を識別するためのGPS id情報を少なくとも含む。
【0051】
第2に、ビットストリームは、GSH2012A/2012Bを含んでいてもよい。GSH2012A/2012Bは、ジオメトリスライスヘッダ或いはジオメトリデータユニットヘッダとも呼ばれ、後述するスライスに対応する制御データの集合である。以降では、スライスという呼称を用いて説明するが、スライスをデータユニットと読み替えることもできる。具体例については後述する。GSH2012A/2012Bは、各GSH2012A/2012Bに対応するGPS2011を指定するためのGPS id情報を少なくとも含む。
【0052】
第3に、ビットストリームは、GSH2012A/2012Bの次に、スライスデータ2013A/2013Bを含んでいてもよい。スライスデータ2013A/2013Bには、幾何情報を符号化したデータが含まれている。スライスデータ2013A/2013Bの一例としては、後述するoccupancy codeやPredicitive codingによる符号化データが挙げられる。
【0053】
以上のように、ビットストリームは、各スライスデータ2013A/2013Bに、1つずつGSH2012A/2012B及びGPS2011が対応する構成となる。
【0054】
上述のように、GSH2012A/2012Bにて、どのGPS2011を参照するかをGPS id情報で指定するため、複数のスライスデータ2013A/2013Bに対して共通のGPS2011を用いることができる。
【0055】
言い換えると、GPS2011は、スライスごとに必ずしも伝送する必要がない。例えば、
図3のように、GSH2012B及びスライスデータ2013Bの直前では、GPS2011を符号化しないようなビットストリームの構成とすることもできる。
【0056】
なお、
図3の構成は、あくまで一例である。各スライスデータ2013A/2013Bに、GSH2012A/2012B及びGPS2011が対応する構成となっていれば、ビットストリームの構成要素として、上述以外の要素が追加されてもよい。
【0057】
例えば、
図3に示すように、ビットストリームは、シーケンスパラメータセット(SPS)2001を含んでいてもよい。また、同様に、伝送に際して、
図3と異なる構成に整形されてもよい。更に、後述する属性情報復号部2060で復号されるビットストリームと合成して単一のビットストリームとして伝送されてもよい。
【0058】
図4は、GPS2011のシンタックス構成の一例である。
【0059】
なお、以下で説明するシンタックス名は、あくまで一例である。以下で説明したシンタックスの機能が同様であれば、シンタックス名は異なっていても差し支えない。
【0060】
GPS2011は、各GPS2011を識別するためのGPS id情報(gps_geom_parameter_set_id)を含んでもよい。
【0061】
なお、
図4のDescriptor欄は、各シンタックスが、どのように符号化されているかを意味している。ue(v)は、符号無し0次指数ゴロム符号であることを意味し、u(1)は、1ビットのフラグであることを意味する。
【0062】
GPS2011は、ツリー合成部2020でインター予測を行うか否かを制御するフラグ(interprediction_enabled_flag)を含んでもよい。
【0063】
例えば、interprediction_enabled_flagの値が「0」の場合は、インター予測を行わないと定義し、interprediction_enabled_flagの値が「1」の場合は、インター予測を行うと定義してもよい。
【0064】
なお、interprediction_enabled_flagは、GPS2011ではなくSPS2001に含まれていてもよい。
【0065】
GPS2011は、ツリー合成部2020でツリータイプを制御するためのフラグ(geom_tree_type)を含んでもよい。例えば、geom_tree_typeの値が「1」の場合は、Predicitive codingを使用すると定義し、geom_tree_typeの値が「0」の場合は、Predicitive codingを使用しないように定義されていてもよい。
【0066】
なお、geom_tree_typeが、GPS2011ではなくSPS2001に含まれていてもよい。
【0067】
GPS2011は、ツリー合成部2020で、Angularモードとして処理を行うかどうかを制御するためのフラグ(geom_angular_enabled)を含んでもよい。
【0068】
例えば、geom_angular_enabledの値が「1」の場合は、AngularモードとしてPredictive codingを行うと定義し、geom_angular_enabledの値が「0」の場合は、AngularモードとしてPredictive codingを行わないように定義されていてもよい。
【0069】
なお、geom_angular_enabledが、GPS2011ではなくSPS2001に含まれていてもよい。
【0070】
GPS2011は、ツリー合成部2020でインター予測のためにグローバル動き補償を行うか否かを制御するフラグ(global_motion_enabled_flag)を含んでもよい。
【0071】
例えば、global_motion_enabled_flagの値が「0」の場合は、グローバル動き補償を行わないと定義し、global_motion_enabled_flagの値が「1」の場合は、グローバル動き補償を行うと定義してもよい。
【0072】
グローバル動き補償を行う場合、各スライスデータには、グローバル動きベクターが含まれていてもよい。
【0073】
なお、global_motion_enabled_flagは、GPS2011ではなくSPS2001に含まれていてもよい。
【0074】
(ツリー合成部2020)
以下、
図5~
図9を用いてツリー合成部2020の処理について説明する。
図5は、ツリー合成部2020における処理の一例を示すフローチャートである。なお、以下では「Predictive geometry coding」を使用してツリーを合成する場合の例について説明する。
【0075】
なお、「Predictive cording」の代わりに「Predictive geometry」、「Predictive geometry coding」、「Predictive tree」等の呼称が用いられる場合もある。
【0076】
図5に示すように、ステップS501において、ツリー合成部2020は、interprediction_enabled_flagの値に基づき、インター予測を使用するかどうかを判定する。
【0077】
ツリー合成部2020は、インター予測を使用すると判定した場合、ステップS502へ進み、インター予測を使用しないと判定した場合、ステップS505へ進む。
【0078】
ステップS502において、ツリー合成部2020は、フレームバッファ2120から参照フレームを取得する。フレームバッファ2120には、以前に復号したフレームが1つ記憶されているとしてもよく、復号したフレームのフレームバッファ2020へのフレームの追加は、1つ或いは規定数のフレームの復号が完了する毎に行われるとしてもよい。ツリー合成部2020は、参照フレームを取得した後、ステップS503に進む。
【0079】
ステップS503において、ツリー合成部2020は、global_motion_enabled_flagに基づき、グローバル動き補償を行うかどうかを判定する。
【0080】
ツリー合成部2020は、グローバル動き補償を行うと判定した場合、ステップS504へ進み、グローバル動き補償を行わないと判定した場合、ステップS505へ進む。
【0081】
ステップS504において、ツリー合成部2020は、ステップS502で取得した参照フレームに対してグローバル動き補償を行う。
【0082】
ここで、グローバル動き補償は、フレームごとの大域的な位置ずれを補正する処理であり、参照フレームの全て或いは指定範囲内の点群に対して、幾何情報復号部2010で復号したグローバル動きベクターに基づく回転・平行移動を適用する処理である。
【0083】
ツリー合成部2020は、グローバル動き補償を行った後、ステップS505に進む。
【0084】
ステップS505において、ツリー合成部2020は、スライスデータの復号を行う。ステップS505の具体的な処理は、後述する。ツリー合成部2020は、スライスデータを復号した後、ステップS506へ進む。
【0085】
ステップS506において、ツリー合成部2020は、処理を終了する。なお、ステップS503及びステップS504の処理、つまり、グローバル動き補償の判定及び実行は、ステップS505のスライスデータの復号処理の中で行われてもよい。
【0086】
図6は、ステップS505におけるスライスデータの復号処理の一例を示すフローチャートである。
【0087】
図6に示すように、ステップS601において、ツリー合成部2020は、スライスデータに対応する予測木の構築を行う。
【0088】
スライスデータには、予測木の各ノードの子ノードの数が深さ優先順に並んだリストが含まれていてもよい。予測木を構築する方法としては、ルートノードから開始して、深さ優先順で、各ノードに、上述のリストで指定された数の子ノードを追加する方法を採ってもよい。
【0089】
ツリー合成部2020は、予測木の構築を完了した後、ステップS602へ進む。
【0090】
ステップS602において、ツリー合成部2020は、予測木の全ノードの処理が完了したかどうかを判定する。
【0091】
ツリー合成部2020は、予測木の全ノードの処理が完了していると判定した場合、ステップS607へ進み、予測木の全ノードの処理が完了していないと判定した場合、ステップS603へ進む。
【0092】
ステップS603において、ツリー合成部2020は、予測木から処理対象ノードを選択する。
【0093】
ツリー合成部2020は、処理対象ノードとして、深さ優先順で前回の処理対象ノードの次にあたるノードを選択してもよい。
【0094】
ツリー合成部2020は、処理対象ノードの選択が完了した後、ステップS604へ進む。
【0095】
ステップS604において、ツリー合成部2020は、処理対象ノードに対応する点の座標を予測する。かかる座標の予測の具体的な方法は、後述する。
【0096】
ツリー合成部2020は、かかる予測が完了した後、ステップS605へ進む。
【0097】
ステップS605において、ツリー合成部2020は、処理対象ノードに対応する点の座標の予測残差を復号する。スライスデータには、各ノードに対応する点の座標の予測残差が含まれていてもよい。
【0098】
ツリー合成部2020は、処理対象ノードの予測残差の復号が完了した後、ステップS606へ進む。
【0099】
ステップS606において、ツリー合成部2020は、処理対象ノードに対応する点の座標を再構成する。ツリー合成部2020は、点の座標について、ステップS604において予測された座標及びステップS605において復号された残差の和によって求めてもよい。
【0100】
ツリー合成部2020は、Angularモードが使用されている場合は、予測残差及び予測座標が球面座標系に基づく値であることを考慮し、非特許文献1及び2に記載の方法で、座標の再構成を行ってもよい。
【0101】
ツリー合成部2020は、Angularモードが使用されている場合は、非特許文献1及び2に記載の方法で、再構成された座標を球面座標系から直交座標系へ変換してもよい。
【0102】
ツリー合成部2020は、座標の再構成が完了した後、ステップ602に戻る。
【0103】
ステップS607において、ツリー合成部2020は、ステップS505の処理を終了する。
【0104】
ここで、ステップS604及びステップS605の順序は、入れ替わってもよい。
【0105】
図7は、ステップS604における座標予測の処理の一例を示すフローチャートである。
【0106】
図7に示すように、ステップS701において、ツリー合成部2020は、予測器フラグを復号する。
【0107】
ここで、スライスデータには、各ノードについて使用する予測器を示すフラグが含まれていてもよい。例えば、スライスデータには、インター予測器かイントラ予測器かを示すフラグや、インター予測器のインデックス等、非特許文献1及び2に記載の内容と同様のフラグが含まれていてもよい。また、スライスデータには、後述するその他のフラグが含まれていてもよい。
【0108】
ツリー合成部2020は、かかる予測器フラグを復号した後、ステップS702へ進む。
【0109】
ステップS702において、ツリー合成部2020は、ステップS701で復号された予測器フラグに基づき、インター予測器を使用するかどうかについて判定する。
【0110】
ツリー合成部2020は、インター予測器を使用すると判定した場合、ステップS704へ進み、インター予測器を使用しないと判定した場合、ステップS703へ進む。
【0111】
ステップS703において、ツリー合成部2020は、処理対象ノードの座標についてイントラ予測を行う。
【0112】
ツリー合成部2020は、イントラ予測を行う場合、処理対象ノードの親ノード或いは祖先ノード(例えば、親ノードの親ノード等)の座標に基づいて予測器を構成し、処理対象ノードの座標を予測する。
【0113】
ツリー合成部2020は、イントラ予測器の構成方法について、非特許文献1及び2に記載の方法を用いてよく、複数あるイントラ予測器のうちステップS701で復号された予測器フラグが示す予測器を使用してもよい。
【0114】
ツリー合成部2020は、イントラ予測が完了した後、ステップS705へ進む。
【0115】
ステップS704において、ツリー合成部2020は、処理対象ノードの座標についてインター予測を行う。
【0116】
ツリー合成部2020は、インター予測を行う場合、参照フレームから処理対象ノードに対応するノードを予測器として選出し、選出された予測器の座標を処理対象ノードの座標の予測値とする。ここで、参照フレームから予測器を選出する方法は後述する。
【0117】
ツリー合成部2020は、インター予測が完了した後、ステップS705へ進む。
【0118】
ステップS705において、ツリー合成部2020は、ステップS605の処理を終了する。
【0119】
図8及び
図9は、ツリー合成部2020のステップS704において、参照フレームから予測器を選出する処理の一例を示す図である。
【0120】
ただし、Angularモードが使用されているものとする。Angularモードにおいて、処理対象ノードの親ノードの点は、直前或いはそれ以前に復号されていると考えてよい。
【0121】
図8の例では、ツリー合成部2020は、処理対象ノードの親ノードに対して、レーザID(L)が等しく且つ方位角(φ)が大きいノードを参照フレームから探し、そのうち方位角(φ)が最小の2つをそれぞれ予測器1及び予測器2とする。
【0122】
図9の例では、ツリー合成部2020は、処理対象ノードの親ノードに対して、レーザID(L)が等しく且つ方位角(φ)がオフセット値(φ
offset)を引いた角度より大きいノードを参照フレームから探し、そのうち方位角(φ)が最小の2つをそれぞれ予測器1及び予測器2とする。
【0123】
ツリー合成部2020は、かかるオフセット値として、負から正の任意の値を採ってもよい。
【0124】
ツリー合成部2020は、フラグに基づいて、
図8に示す予測器1及び予測器2、
図9に示す予測器1及び予測器2のうち、使用する予測器を決定してよい。スライスデータには、各ノードについて、かかるのフラグが含まれていてもよい。また、かかるフラグは、ステップS701で復号されるとしてもよい。
【0125】
上述のように、ツリー合成部2020が、処理対象ノードの親ノードのレーザIDと方位角と方位角のオフセット値とに基づいて、予測器を選出することで、処理対象フレームや参照フレームにずれや差異があった場合にも頑健に適切な予測器の選択ができる。
【0126】
また、かかるオフセット値は、スライスデータに、ノード毎の値或いは複数のノード毎の値として含まれていてもよい。
【0127】
さらに、かかるオフセット値は、ヘッダ(GSH、SPS、GPS又はその他のヘッダ)に、レーザID毎、スライス毎、フレーム毎又はシーケンス毎の値として含まれていてもよい。
【0128】
かかるオフセット値は、事前に定義するオフセット値の候補から導出されるとしてもよい。
【0129】
例えば、かかるオフセット値の候補は、α1からα2の全て或いは一部の整数に固定値sをかけた値であると定義されてもよい。
【0130】
ここで、α1及びα2は、事前に設定する任意の整数とし、α1<=α2とする。固定値sは、LiDARのレーザスピード等に基づき設定されてもよい。
【0131】
α1からα2の一部の整数としては、例えば、α1を-8とし、α2を8とすると{-8、-4、0、4、8}のように一定間隔毎の整数や、{-8、-4、-2、-1、0、1、2、4、8}のように指数間隔毎の整数等が考えられる。
【0132】
ツリー合成部2020は、上述のオフセット値の候補をオフセット値の第1候補とし、かかる第1候補に対して所定条件に基づいて絞り込みを行った第2候補からオフセット値を導出するとしてもよい。
【0133】
かかる所定条件は、直前に処理したノードのオフセット値に基づく条件であってもよい。
【0134】
例えば、所定条件は、直前に処理したノードのオフセット値をi×sとした場合に、第1候補のうち(i+β1)×s以上で(i+β2)×s以下であるという条件であってもよい。ただし、β1及びβ2は、事前に設定する任意の整数とし、β1<=β2とする。
【0135】
ツリー合成部2020は、かかる条件を満たす値を、第2候補としてもよい。例えば、ツリー合成部2020は、i+β1>α1或いはi+β2<α2の場合、第1候補に対して第2候補を絞り込むことができる。
【0136】
また、所定条件は、例えば、グローバル動きベクトルの大きさに基づく条件であってもよい。
【0137】
例えば、所定条件は、グローバル動きベクトルの回転量又は移動量が閾値以下だった場合に、第1候補のうちγ1以上でγ2以下であるという条件であってもよい。ただし、γ1及びγ2は、事前に設定する任意の整数とし、γ1<=γ2とする。
【0138】
ツリー合成部2020は、かかる条件を満たす値を、第2候補としてもよい。例えば、ツリー合成部2020は、γ1>α1或いはγ2<α2の場合、第1候補に対して第2候補を絞り込むことができる。
【0139】
グローバル動きベクトルは、スライスデータ或いはヘッダ(GSH、SPS、GPS又はその他のヘッダ)に含まれていてもよい。
【0140】
グローバル動きベクトルの回転量又は移動量が閾値以下であるかどうかを示すフラグが、スライスデータ或いははヘッダ(GSH、SPS、GPS又はその他のヘッダ)に含まれていてもよい。
【0141】
いずれも、かかる処理(例えば、ステップS502やステップS504)よりも前に復号済みとされていてもよい。
【0142】
ツリー合成部2020は、第2候補が1つに絞り込まれる場合は、オフセットを示すデータの復号をスキップしてもよい。また、ツリー合成部2020は、絞り込まれた1つの候補から、オフセット値は導出してもよい。
【0143】
例えば、所定条件が直前に処理したノードのオフセット値に基づく条件である例において、ツリー合成部2020は、β1及びβ2が共に0だった場合、第1候補が{-4×s、-3×s、-2×s、-1×s、0、1×s、2×s、3×s、4×s}であり、直前に処理したノードのオフセット値を-1×sとすると、第2候補は{-1×s}のただ1つとなり、オフセット値を-1×sとしてもよい。
【0144】
例えば、所定の条件がグローバル動きベクトルの大きさに基づく条件である例において、ツリー合成部2020は、γ1及びγ2が共に0だった場合、第1候補が{-4×s、-3×s、-2×s、-1×s、0×s、1×s、2×s、3×s、4×s}であり、処理対象フレームのグローバル動きベクトルの大きさが閾値以下とすると、第2候補は{0×s}のただ1つとなり、オフセット値を0×sとしてもよい。
【0145】
ツリー合成部2020が、オフセット値の候補を絞り込む、或いは、復号をスキップすることで、オフセット値を示すデータの符号量を削減すると共に、符号化時にオフセットの設定を効率良く行うことができ、符号化時間を短縮することができる。
【0146】
上述のように、ツリー合成部2020は、Predictive codingにおいて、処理対象ノードの親ノードのレーザID及び方位角からオフセット値を引いた方位角に基づいてインター予測器を選出する場合に、事前に定義したオフセット値の第1候補中から、所定方法で、第2候補を選出し、かかる第2候補の中からオフセット値を特定するように構成されている。
【0147】
また、ツリー合成部2020は、上述の所定方法として、直前に処理したノードのオフセット値に基づいて第2候補を選出するように構成されていてもよい。
【0148】
また、ツリー合成部2020は、上述の所定方法として、処理対象フレームのグローバル動きベクトルの大きさに基づいて、第2候補を選出するように構成されていてもよい。
【0149】
さらに、ツリー合成部2020は、第2候補が1つに絞り込まれた場合に、オフセット値を示すデータの復号をスキップするように構成されていてもよい。
【0150】
(点群符号化装置100)
以下、
図10を参照して、本実施形態に係る点群符号化装置100について説明する。
図10は、本実施形態に係る点群符号化装置100の機能ブロックの一例について示す図である。
【0151】
図10に示すように、点群符号化装置100は、座標変換部1010と、幾何情報量子化部1020と、ツリー解析部1030と、近似表面解析部1040と、幾何情報符号化部1050と、幾何情報再構成部1060と、色変換部1070と、属性転移部1080と、RAHT部1090と、LoD算出部1100と、リフティング部1110と、属性情報量子化部1120と、属性情報符号化部1130と、フレームバッファ1140とを有する。
【0152】
座標変換部1010は、入力点群の3次元座標系から、任意の異なる座標系への変換処理を行うよう構成されている。座標変換は、例えば、入力点群を回転することにより、入力点群のx、y、z座標を任意のs、t、u座標に変換してもよい。また、変換のバリエーションの1つとして、入力点群の座標系をそのまま使用してもよい。
【0153】
幾何情報量子化部1020は、座標変換後の入力点群の位置情報の量子化及び座標が重複する点の除去を行うように構成されている。なお、量子化ステップサイズが1の場合は、入力点群の位置情報と量子化後の位置情報とが一致する。すなわち、量子化ステップサイズが1の場合は、量子化を行わない場合と等価になる。
【0154】
ツリー解析部1030は、量子化後の点群の位置情報を入力として、後述のツリー構造に基づいて、符号化対象空間のどのノードに点が存在するかについて示すoccupancy codeを生成するように構成されている。
【0155】
ツリー解析部1030は、本処理において、符号化対象空間を再帰的に直方体で区切ることにより、ツリー構造を生成するように構成されている。
【0156】
ここで、ある直方体内に点が存在する場合、かかる直方体を複数の直方体に分割する処理を、直方体が所定のサイズになるまで再帰的に実行することでツリー構造を生成することができる。なお、かかる各直方体をノードと呼ぶ。また、ノードを分割して生成される各直方体を子ノードと呼び、子ノード内に点が含まれるか否かについて0又は1で表現したものがoccupancy codeである。
【0157】
以上のように、ツリー解析部1030は、所定のサイズになるまでノードを再帰的に分割しながら、occupancy codeを生成するように構成されている。
【0158】
本実施形態では、上述の直方体を常に立方体として8分木分割を再帰的に行う「Octree」と呼ばれる手法、及び、8分木分割に加え、4分木分割及び2分木分割を行う「QtBt」と呼ばれる手法を使用することができる。
【0159】
ここで、「QtBt」を使用するか否かについては、制御データとして点群復号装置200に伝送される。
【0160】
或いは、任意のツリー構成を用いるPredictive codingを使用するように指定されてもよい。かかる場合、ツリー解析部1030が、ツリー構造を決定し、決定されたツリー構造は、制御データとして点群復号装置200へ伝送される。
【0161】
例えば、ツリー構造の制御データは、
図5~
図9で説明した手順で復号できるよう構成されていてもよい。
【0162】
近似表面解析部1040は、ツリー解析部1030によって生成されたツリー情報を用いて、近似表面情報を生成するように構成されている。
【0163】
近似表面情報は、例えば、物体の3次元点群データを復号する際等において、点群が物体表面に密に分布しているような場合に、個々の点群を復号するのではなく、点群の存在領域を小さな平面で近似して表現したものである。
【0164】
具体的には、近似表面解析部1040は、例えば、「Trisoup」と呼ばれる手法で、近似表面情報を生成するように構成されていてもよい。また、Lidar等で取得した疎な点群を復号する場合は、本処理を省略することができる。
【0165】
幾何情報符号化部1050は、ツリー解析部1030によって生成されたoccupancy code及び近似表面解析部1040によって生成された近似表面情報等のシンタックスを符号化してビットストリーム(幾何情報ビットストリーム)を生成するように構成されている。ここで、ビットストリームには、例えば、
図4で説明したシンタックスが含まれていてもよい。
【0166】
符号化処理は、例えば、コンテクスト適応二値算術符号化処理である。ここで、例えば、シンタックスは、位置情報の復号処理を制御するための制御データ(フラグやパラメータ)を含む。
【0167】
幾何情報再構成部1060は、ツリー解析部1030によって生成されたツリー情報及び近似表面解析部1040によって生成された近似表面情報に基づいて、符号化対象の点群データの各点の幾何情報(符号化処理が仮定している座標系、すなわち、座標変換部1010における座標変換後の位置情報)を再構成するように構成されている。
【0168】
フレームバッファ1140は、幾何情報再構成部1060によって再構成された幾何情報を入力とし、参照フレームとして保存するように構成されている。
【0169】
保存された参照フレームは、ツリー解析部1030においてインター予測を行う場合に、フレームバッファ1140から読み出されて参照フレームとして使用される。
【0170】
色変換部1070は、入力の属性情報が色情報であった場合に、色変換を行うように構成されている。色変換は、必ずしも実行する必要は無く、色変換処理の実行の有無については、制御データの一部として符号化され、点群復号装置200へ伝送される。
【0171】
属性転移部1080は、入力点群の位置情報、幾何情報再構成部1060における再構成後の点群の位置情報及び色変換部1070での色変化後の属性情報に基づいて、属性情報の歪みが最小となるように属性値を補正するように構成されている。具体的な補正方法は、例えば、非特許文献2に記載の方法を適用できる。
【0172】
RAHT部1090は、属性転移部1080による転移後の属性情報及び幾何情報再構成部1060によって生成された幾何情報を入力とし、RAHT(Region Adaptive Hierarchical Transform)と呼ばれるHaar変換の一種を用いて、各点の残差情報を生成するように構成されている。RAHTの具体的な処理としては、例えば、上述の非特許文献2に記載の方法を用いることができる。
【0173】
LoD算出部1100は、幾何情報再構成部1060によって生成された幾何情報を入力とし、LoD(Level of Detail)を生成するように構成されている。
【0174】
LoDは、ある点の属性情報から、他のある点の属性情報を予測し、予測残差を符号化或いは復号するといった予測符号化を実現するための参照関係(参照する点及び参照される点)を定義するための情報である。
【0175】
言い換えると、LoDは、幾何情報に含まれる各点を複数のレベルに分類し、下位のレベルに属する点については上位のレベルに属する点の属性情報を用いて属性を符号化或いは復号するといった階層構造を定義した情報である。
【0176】
LoDの具体的な決定方法としては、例えば、上述の非特許文献2に記載の方法を用いてもよい。
【0177】
リフティング部1110は、LoD算出部1100によって生成されたLoD及び属性転移部1080での属性転移後の属性情報を用いて、リフティング処理により残差情報を生成するように構成されている。
【0178】
リフティングの具体的な処理としては、例えば、上述の非特許文献2に記載の方法を用いてもよい。
【0179】
属性情報量子化部1120は、RAHT部1090又はリフティング部1110から出力される残差情報を量子化するように構成されている。ここで、量子化ステップサイズが1の場合は、量子化を行わない場合と等価である。
【0180】
属性情報符号化部1130は、属性情報量子化部1120から出力される量子化後の残差情報等をシンタックスとして符号化処理を行い、属性情報に関するビットストリーム(属性情報ビットストリーム)を生成するように構成されている。
【0181】
符号化処理は、例えば、コンテクスト適応二値算術符号化処理である。ここで、例えば、シンタックスは、属性情報の復号処理を制御するための制御データ(フラグ及びパラメータ)を含む。
【0182】
点群符号化装置100は、以上の処理により、点群内の各点の位置情報及び属性情報を入力として符号化処理を行い、幾何情報ビットストリーム及び属性情報ビットストリームを出力するように構成されている。
【0183】
また、上述の点群符号化装置100及び点群復号装置200は、コンピュータに各機能(各工程)を実行させるプログラムであって実現されていてもよい。
【0184】
なお、上記の各実施形態では、本発明を点群符号化装置100及び点群復号装置200への適用を例にして説明したが、本発明は、かかる例のみに限定されるものではなく、点群符号化装置100及び点群復号装置200の各機能を備えた点群符号化/復号システムにも同様に適用できる。
【産業上の利用可能性】
【0185】
なお、本実施形態によれば、例えば、動画像通信において総合的なサービス品質の向上を実現できることから、国連が主導する持続可能な開発目標(SDGs)の目標9「レジリエントなインフラを整備し、持続可能な産業化を推進するとともに、イノベーションの拡大を図る」に貢献することが可能となる。
【符号の説明】
【0186】
10…点群処理システム
100…点群符号化装置
1010…座標変換部
1020…幾何情報量子化部
1030…ツリー解析部
1040…近似表面解析部
1050…幾何情報符号化部
1060…幾何情報再構成部
1070…色変換部
1080…属性転移部
1090…RAHT部
1100…LoD算出部
1110…リフティング部
1120…属性情報量子化部
1130…属性情報符号化部
1140…フレームバッファ
200…点群復号装置
2010…幾何情報復号部
2020…ツリー合成部
2030…近似表面合成部
2040…幾何情報再構成部
2050…逆座標変換部
2060…属性情報復号部
2070…逆量子化部
2080…RAHT部
2090…LoD算出部
2100…逆リフティング部
2110…逆色変換部
2120…フレームバッファ