(19)【発行国】日本国特許庁(JP)
(12)【公報種別】公表特許公報(A)
(11)【公表番号】
(43)【公表日】2024-02-08
(54)【発明の名称】点群復号化方法、点群符号化方法、復号器及び符号器
(51)【国際特許分類】
G06T 9/40 20060101AFI20240201BHJP
【FI】
G06T9/40
【審査請求】有
【予備審査請求】未請求
(21)【出願番号】P 2023537455
(86)(22)【出願日】2020-12-22
(85)【翻訳文提出日】2023-06-19
(86)【国際出願番号】 CN2020138435
(87)【国際公開番号】W WO2022133755
(87)【国際公開日】2022-06-30
(81)【指定国・地域】
(71)【出願人】
【識別番号】516227559
【氏名又は名称】オッポ広東移動通信有限公司
【氏名又は名称原語表記】GUANGDONG OPPO MOBILE TELECOMMUNICATIONS CORP., LTD.
【住所又は居所原語表記】No. 18 Haibin Road,Wusha, Chang’an,Dongguan, Guangdong 523860 China
(74)【代理人】
【識別番号】100120031
【氏名又は名称】宮嶋 学
(74)【代理人】
【識別番号】100107582
【氏名又は名称】関根 毅
(74)【代理人】
【識別番号】100152205
【氏名又は名称】吉田 昌司
(74)【代理人】
【識別番号】100137523
【氏名又は名称】出口 智也
(72)【発明者】
【氏名】ユアン、ホイ
(72)【発明者】
【氏名】ワン、ルー
(72)【発明者】
【氏名】ワン、シアオホイ
(72)【発明者】
【氏名】リウ、チー
(57)【要約】
本出願の実施形態において、点群復号化方法、点群符号化方法、復号器及び符号器が提供される。当該復号化方法は以下の内容を含む。点群のビットストリームを解析することにより、点群における1つの目標点の属性情報の初期再構成値を得る。初期再構成値を初期輝度値及び初期彩度値に変換する。カルマンフィルタリングアルゴリズムを利用して初期彩度値をフィルタリングすることにより、最終彩度値を得る。最終彩度値及び初期輝度値に基づいて、目標点の属性情報の最終再構成値を得る。目標点の属性情報の最終再構成値に基づいて、復号化された点群を得る。本出願に係る解決策では、初期再構成値を初期輝度値及び初期彩度値に変換し、カルマンフィルタリングアルゴリズムを利用して初期彩度値のみをフィルタリングすることにより、点群復号化の復号化効果を高めることができる。
【特許請求の範囲】
【請求項1】
点群復号化方法であって、
点群のビットストリームを解析することにより、前記点群における1つの目標点の属性情報の初期再構成値を得ることと、
前記初期再構成値を初期輝度値及び初期彩度値に変換することと、
カルマンフィルタリングアルゴリズムを利用して前記初期彩度値をフィルタリングすることにより、最終彩度値を得ることと、
前記最終彩度値及び前記初期輝度値に基づいて、前記目標点の属性情報の最終再構成値を得ることと、
前記目標点の属性情報の最終再構成値に基づいて、復号化された点群を得ることとを含む、
ことを特徴とする点群復号化方法。
【請求項2】
前記カルマンフィルタリングアルゴリズムを利用して前記初期彩度値をフィルタリングすることにより、最終彩度値を得ることは、
前記目標点の前の1つ又は複数の点の属性情報の再構成値の彩度値を測定値とし、前記カルマンフィルタリングアルゴリズムを利用して前記初期彩度値をフィルタリングすることにより、最終彩度値を得ることを含む、
ことを特徴とする請求項1に記載の方法。
【請求項3】
前記目標点の前の1つ又は複数の点の属性情報の再構成値の彩度値を測定値とし、前記カルマンフィルタリングアルゴリズムを利用して前記初期彩度値をフィルタリングすることにより最終彩度値を得ることは、
前記目標点の前の1つ又は複数の点の属性情報の再構成値の平均再構成値を計算することと、
前記平均再構成値を平均輝度値及び平均彩度値に変換することと、
前記平均彩度値を測定値とし、前記カルマンフィルタリングアルゴリズムを利用して前記初期彩度値をフィルタリングすることにより、前記最終彩度値を得ることを含む、
ことを特徴とする請求項2に記載の方法。
【請求項4】
前記目標点の前の1つ又は複数の点は、復号化順に基づいて前記目標点の前に位置する1つ又は複数の点である、
ことを特徴とする請求項2に記載の方法。
【請求項5】
前記目標点の属性情報の残差値は、複数の量子化ステップサイズのうちの目標量子化ステップサイズに基づいて逆量子化を行うことにより得られ、前記初期再構成値を初期輝度値及び初期彩度値に変換することは、
前記目標量子化ステップサイズが閾値N以上である場合、前記初期再構成値を前記初期輝度値及び前記初期彩度値に変換することを含み、
Nは非負整数である、
ことを特徴とする請求項1に記載の方法。
【請求項6】
前記複数の量子化ステップサイズは昇順にソートされ、Nは前記複数の量子化ステップサイズのうちのn番目の量子化ステップサイズの値であり、nは正の整数である、
ことを特徴とする請求項5に記載の方法。
【請求項7】
前記初期再構成値を初期輝度値及び初期彩度値に変換することは、
色空間変換関数を利用して前記初期再構成値を前記初期輝度値及び前記初期彩度値に変換することを含み、
前記初期輝度値及び前記初期彩度値は、ディスプレイスクリーンによってサポートされる色空間内に位置する、
ことを特徴とする請求項1に記載の方法。
【請求項8】
前記点群のビットストリームを解析することにより、前記点群における1つの目標点の属性情報の初期再構成値を得ることは、
前記点群における1つの詳細レベル(LOD)層における点の数が閾値Mより小さい場合、前記LOD層における各点に対して、可逆符号化された点の属性情報の残差値及び点の属性情報の予測値に基づいて、点の属性情報の初期再構成値を得ること、又は、
前記点群における1つのLOD層における点の数が前記閾値M以上である場合、前記LOD層における(m*M)番目の点に対して、可逆符号化された点の属性情報の残差値及び点の属性情報の予測値に基づいて、点の属性情報の初期再構成値を得ることを含み、
Mは1より大きい正の整数であり、mは0以上の正の整数である、
ことを特徴とする請求項1に記載の方法。
【請求項9】
前記方法は、
前記ビットストリームを解析することにより、前記ビットストリームにおける、属性情報の残差値が逆量子化を必要としない点の数を得ることをさらに含む、
ことを特徴とする請求項8に記載の方法。
【請求項10】
前記点群のビットストリームを解析することにより、前記点群における1つの目標点の属性情報の初期再構成値を得ることは、
前記点群における1つのLOD層における点の数が閾値Tより小さい場合、前記LOD層における各点に対して、点の属性情報の最終再構成値を当該点の属性情報の真値に置き換えること、又は、
前記点群における1つのLOD層における点の数が前記閾値T以上である場合、前記LOD層における(t*T)番目の点の属性情報の最終再構成値を当該点の属性情報の真値に置き換えることを含み、
Tは1より大きい正の整数であり、tは0以上の正の整数である、
ことを特徴とする請求項1に記載の方法。
【請求項11】
前記方法は、
前記ビットストリームを解析することにより、前記ビットストリームにおける、属性情報の最終再構成値が真値である点の数と、点の属性情報の真値とを得ることをさらに含む、
ことを特徴とする請求項10に記載の方法。
【請求項12】
前記方法は、前記点群を1つ又は複数のLOD層に分割することをさらに含み、
各LOD層は1つ又は複数の点を含む、
ことを特徴とする請求項1に記載の方法。
【請求項13】
前記点群のビットストリームを解析することにより、前記点群における1つの目標点の属性情報の初期再構成値を得ることは、
前記ビットストリームを解析することにより、前記目標点の位置情報の再構成情報を得ることと、
前記目標点の位置情報の再構成情報に基づいて、前記目標点の属性情報の予測値を得ることと、
前記ビットストリームを解析することにより、前記目標点の属性情報の残差値を得ることと、
前記目標点の属性情報の予測値及び前記目標点の属性情報の残差値に基づいて、前記目標点の属性情報の初期再構成値を得ることとを含む、
ことを特徴とする請求項1に記載の方法。
【請求項14】
点群符号化方法であって、
点群における1つの目標点の位置情報を処理することにより、前記目標点の位置情報の再構成情報を得ることと、
前記目標点の位置情報の再構成情報に基づいて、前記目標点の属性情報の予測値を得ることと、
前記点群における前記目標点の属性情報を処理することにより、前記目標点の属性情報の真値を得ることと、
前記目標点の属性情報の予測値及び前記目標点の属性情報の真値に基づいて、前記目標点の属性情報の残差値を得ることと、
ビットストリームに書き込まれる必要がある、可逆符号化された点の属性情報の残差値の数と前記目標点の属性情報の残差値とを符号化することにより、前記ビットストリームを得ることとを含む、
ことを特徴とする点群符号化方法。
【請求項15】
前記ビットストリームに書き込まれる必要がある、可逆符号化された点の属性情報の残差値の数と前記目標点の属性情報の残差値とを符号化することにより、前記ビットストリームを得ることは、
前記点群における1つの詳細レベル(LOD)層における点の数が閾値Mより小さい場合、前記LOD層における各点に対して、逆量子化されていない点の属性情報の残差値を符号化することにより、前記ビットストリームを得ること、又は、
前記点群における1つのLOD層における点の数が前記閾値M以上である場合、前記LOD層における(m*M)番目の点に対して、逆量子化されていない点の属性情報の残差値を符号化することにより、前記ビットストリームを得ることを含み、
Mは1より大きい正の整数であり、mは0以上の正の整数である、
ことを特徴とする請求項14に記載の方法。
【請求項16】
前記方法は、前記点群を1つ又は複数のLOD層に分割することをさらに含み、
各LOD層は1つ又は複数の点を含む、
ことを特徴とする請求項14に記載の方法。
【請求項17】
復号器であって、解析ユニット、変換ユニット、フィルタリングユニット、第一処理ユニット、及び第二処理ユニットを含み、
前記解析ユニットは、点群のビットストリームを解析することにより、前記点群における1つの目標点の属性情報の初期再構成値を得るように構成されており、
前記変換ユニットは、前記初期再構成値を初期輝度値及び初期彩度値に変換するように構成されており、
前記フィルタリングユニットは、カルマンフィルタリングアルゴリズムを利用して前記初期彩度値をフィルタリングすることにより、最終彩度値を得るように構成されており、
前記第一処理ユニットは、前記最終彩度値及び前記初期輝度値に基づいて、前記目標点の属性情報の最終再構成値を得るように構成されており、
前記第二処理ユニットは、前記目標点の属性情報の最終再構成値に基づいて、復号化された点群を得るように構成されている、
ことを特徴とする復号器。
【請求項18】
符号器あって、第一処理ユニット、第二処理ユニット、第三処理ユニット、第四処理ユニット、及び符号化ユニットを含み、
前記第一処理ユニットは、点群における1つの目標点の位置情報を処理することにより、前記目標点の位置情報の再構成情報を得るように構成されており、
前記第二処理ユニットは、前記目標点の位置情報の再構成情報に基づいて、前記目標点の属性情報の予測値を得るように構成されており、
前記第三処理ユニットは、前記点群における前記目標点の属性情報を処理することにより、前記目標点の属性情報の真値を得るように構成されており、
前記第四処理ユニットは、前記目標点の属性情報の予測値及び前記目標点の属性情報の真値に基づいて、前記目標点の属性情報の残差値を得るように構成されており、
前記符号化ユニットは、ビットストリームに書き込まれる必要がある、可逆符号化された点の属性情報の残差値の数と前記目標点の属性情報の残差値とを符号化することにより、前記ビットストリームを得るように構成されている、
ことを特徴とする符号器。
【請求項19】
電子機器であって、プロセッサ及びコンピュータ可読記憶媒体を含み、
前記プロセッサはコンピュータプログラムを実行することに適しており、
前記コンピュータ可読記憶媒体にコンピュータプログラムが記憶されており、前記コンピュータプログラムが前記プロセッサによって実行される場合、請求項1~13のいずれか一項に記載の点群復号化方法又は請求項14~16のいずれか一項に記載の点群復号化方法を実現する、
ことを特徴とする電子機器。
【請求項20】
コンピュータ可読記憶媒体であって、前記コンピュータ可読記憶媒体はコンピュータ命令を含み、前記コンピュータ命令がプロセッサによってロードされ且つ実行されて、請求項1~13のいずれか一項に記載の点群復号化方法又は請求項14~16のいずれか一項に記載の点群復号化方法を実現することに適している、
ことを特徴とするコンピュータ可読記憶媒体。
【発明の詳細な説明】
【技術分野】
【0001】
本出願の実施形態は点群符号化・復号化分野に関し、さらに具体的に、点群復号化方法、点群符号化方法、復号器及び符号器に関する。
【背景技術】
【0002】
点群は、仮想/拡張現実、ロボット、地理情報システム、医学分野など様々な分野に普及し始めている。走査装置の基準及び速度の継続的な向上に連れて、物体表面上の大量の点群を正確に取得することができ、1つのシーンで数十万個の点を取得することができる。このような大量の点は、コンピュータの記憶及び伝送に挑戦をもたらす。そのため、点の圧縮が重要な課題となっている。
【0003】
点群の圧縮には、主に、その位置情報及び色情報を圧縮する必要があるが、具体的に、まず、点群の位置情報を八分木符号化し、八分木符号化された位置情報に基づいてその色情報を予測し、次に、元の色情報と差分をとることで色情報を符号化することにより、点群の符号化を実現する。
【0004】
現在まで、点の色情報を予測するプロセスにおいて、予測効果を如何に高めるかが本分野の解決すべき技術的課題である。
【発明の概要】
【0005】
本出願の実施形態において、点群復号化方法、点群符号化方法、復号器及び符号器が提供され、それによって、点群復号化のプロセスにおける再構成の精度を向上させ、さらに復号化効果を高めることができる。
【0006】
1つの様態において、点群復号化方法が提供される。当該方法は以下の内容を含む。点群のビットストリームを解析することにより、点群における1つの目標点の属性情報の初期再構成値を得る。初期再構成値を初期輝度値及び初期彩度値に変換する。カルマンフィルタリングアルゴリズム(Kalman filtering algorithm)を利用して初期彩度値をフィルタリングすることにより、最終彩度値を得る。最終彩度値及び初期輝度値に基づいて、目標点の属性情報の最終再構成値を得る。目標点の属性情報の最終再構成値に基づいて、復号化された点群を得る。
【0007】
別の態様において、点群符号化方法が提供される。当該方法は以下の内容を含む。点群における1つの目標点の位置情報を処理することにより、目標点の位置情報の再構成情報を得る。目標点の位置情報の再構成情報に基づいて、目標点の属性情報の予測値を得る。点群における目標点の属性情報を処理することにより、目標点の属性情報の真値(actual value)を得る。目標点の属性情報の予測値及び目標点の属性情報の真値に基づいて、目標点の属性情報の残差値を得る。ビットストリームに書き込まれる必要がある、可逆符号化された(lossy encoded)点の属性情報の残差値の数と目標点の属性情報の残差値とを符号化することにより、ビットストリームを得る。
【0008】
別の態様において、復号器が提供される。当該復号器は解析ユニット、変換ユニット、フィルタリングユニット、第一処理ユニット、及び第二処理ユニットを含む。解析ユニットは、点群のビットストリームを解析することにより、点群における1つの目標点の属性情報の初期再構成値を得るように構成されている。変換ユニットは、初期再構成値を初期輝度値及び初期彩度値に変換するように構成されている。フィルタリングユニットは、カルマンフィルタリングアルゴリズムを利用して初期彩度値をフィルタリングすることにより、最終彩度値を得るように構成されている。第一処理ユニットは、最終彩度値及び初期輝度値に基づいて、目標点の属性情報の最終再構成値を得るように構成されている。第二処理ユニットは、目標点の属性情報の最終再構成値に基づいて、復号化された点群を得るように構成されている。
【0009】
別の態様において、符号器が提供される。当該符号器は第一処理ユニット、第二処理ユニット、第三処理ユニット、第四処理ユニット、及び符号化ユニットを含む。第一処理ユニットは、点群における1つの目標点の位置情報を処理することにより、目標点の位置情報の再構成情報を得るように構成されている。第二処理ユニットは、目標点の位置情報の再構成情報に基づいて、目標点の属性情報の予測値を得るように構成されている。第三処理ユニットは、点群における目標点の属性情報を処理することにより、目標点の属性情報の真値を得るように構成されている。第四処理ユニットは、目標点の属性情報の予測値及び目標点の属性情報の真値に基づいて、目標点の属性情報の残差値を得るように構成されている。符号化ユニットは、ビットストリームに書き込まれる必要がある、可逆符号化された点の属性情報の残差値の数と目標点の属性情報の残差値とを符号化することにより、ビットストリームを得るように構成されている。
【0010】
別の態様において、本出願の実施形態では、点群メディアのデータ処理装置が提供される。当該点群メディアのデータ処理装置は、プロセッサ及びコンピュータ可読記憶媒体を含む。プロセッサは、コンピュータ命令を実行することに適している。コンピュータ可読記憶媒体にコンピュータ命令が記憶されており、コンピュータ命令がプロセッサによってロードされて、上記点群メディアのデータ処理方法を実行することに適している。
【0011】
別の態様において、本出願の実施形態では、コンピュータ可読記憶媒体が提供される。当該コンピュータ可読記憶媒体にコンピュータ命令が記憶されており、当該コンピュータ命令がコンピュータ装置のプロセッサによって読み取られ且つ実行される場合、コンピュータ装置に上記点群メディアのデータ処理方法を実行させる。
【0012】
本出願に係る解決策では、初期再構成値を初期輝度値及び初期彩度値に変換し、カルマンフィルタリングアルゴリズムを利用して初期彩度値のみをフィルタリングすることにより、目標点の属性情報の再構成の精度を向上させることができ、点の再構成プロセスの品質を向上させることができ、それに対応して、点群復号化の復号化効果を高めることができる。さらに、カルマンフィルタリングアルゴリズムは定常信号の処理により適しており、点群の輝度値は変動が大きいため、カルマンフィルタリングアルゴリズムを利用して初期彩度値のみをフィルタリングすることで、フィルタリング効果を高め、点群復号化の復号化効果をより高めることができる。
【図面の簡単な説明】
【0013】
【
図1】
図1は、本出願の実施形態に係る符号化フレームワークを示すブロック図である。
【
図2】
図2は、本出願の実施形態に係る詳細レベル(LOD)層を示すブロック図である。
【
図3】
図3は、本出願の実施形態に係る復号化フレームワークを示すブロック図である。
【
図4】
図4は、本出願の実施形態に係る点群復号化方法を示すフローチャートである。
【
図5】
図5は、本出願の実施形態に係るカルマンフィルタリングの原理を示す概略図である。
【
図6】
図6は、本出願の実施形態に係る点群復号化方法を示す別のフローチャートである。
【
図7】
図7は、本出願の実施形態に係る点群符号化方法を示すフローチャートである。
【
図8】
図8は、本出願の実施形態に係る復号器を示すブロック図である。
【
図9】
図9は、本出願の実施形態に係る符号器を示すブロック図である。
【
図10】
図10は、本出願の実施形態に係る電子機器を示すブロック図である。
【発明を実施するための形態】
【0014】
次に、点群に関する概念について説明する。
【0015】
点群(point cloud)は、空間内に不規則に分布する、3次元(three-dimensional、3D)物体又は3次元シーンの空間構造及び表面属性を表現する離散的な点の集合である。
【0016】
点群データ(point cloud data)は、点群の具体的な記録形式であり、点群における各点の点群データは、幾何情報及び属性情報を含む。点群における各点の幾何情報は、当該点のデカルト3次元座標データを指し、点群における各点の属性情報は、色情報、材質情報及びレーザ反射強度情報のうちの少なくとも1つを含むことができるが、それらに限定されない。色情報は、任意の色空間上の情報であってよい。例えば、色情報は、赤緑青(Red Green Blue、RGB)情報であってよい。別の例として、色情報は、輝度彩度(YCbCr、YUV)情報であってもよい。ここで、Yは輝度(luma)を表し、Cb(U)は青色彩度を表し、Cr(V)は赤色彩度を表し、U及びVは彩度(chroma)を表し、彩度は、色差情報を記述するために用いられる。
【0017】
点群における各点は、同じ数の属性情報を有する。例えば、点群における各点は、色情報及びレーザ反射強度情報という2種類の属性情報を有する。別の例として、点群における各点は、色情報、材質情報及びレーザ反射強度情報という3種類の属性情報を有する。点群メディアのカプセル化プロセスにおいて、点の幾何情報は、点群メディアの幾何コンポーネント又は幾何成分(geometry component)とも呼ばれ、点の属性情報は、点群メディアの属性コンポーネント又は属性成分(attribute component)とも呼ばれることができる。点群メディアは、1つの幾何成分と、1つ又は複数の属性成分とを含むことができる。
【0018】
適用場面に基づいて、点群を機械認知点群(machine-perceived point cloud)及び人眼認知点群(human-eye-perceived point cloud)という2つの種類に分類することができる。機械認知点群の適用場面は、自律型ナビゲーションシステム、リアルタイム検査システム、地理情報システム、視覚選別ロボット、救助・災害救援ロボットなどの点群の適用場面を含むが、それらに限定されない。人眼認知点群の適用場面は、デジタル文化遺産、自由視点放送、3次元没入型コミュニケーション、3次元没入型インタラクションなどの点群の適用場面を含むが、それらに限定されない。点群の取得方法は、コンピュータによる生成、3Dレーザースキャン、3D撮影計測などを含むが、それらに限定されない。コンピュータは、仮想の3次元物体及びシーンの点群を生成することができる。3Dスキャンは、静的な現実世界の3次元物体又はシーンの点群を取得することができ、1秒ごとに百万レベルの点群を取得することができる。3D撮影は、動的な現実世界の3次元物体又はシーンの点群を取得することができ、1秒ごとに千万レベルの点群を取得することができる。具体的に、物体表面上の点群は、光起電力レーダー(photovoltaic radar)、レーザーレーダー、レーザースキャナ、多視点カメラなどの収集デバイスを通じて収集されることができる。レーザー計測原理に基づいて得られる点群は、点の3次元座標情報及び点のレーザ反射強度(reflectance)を含むことができる。撮影計測原理に基づいて得られる点群は、点の三次元座標情報及び点の色情報を含むことができる。レーザー計測原理及び撮影計測原理の両方に基づいて得られる点群は、点の三次元座標情報、点のレーザ反射強度(reflectance)、及び点の色情報を含むことができる。それに応じて、点群の取得方法に基づいて、点群を、第一の種類の静的な点群、第二の種類の動的な点群、及び第三の種類の動的に取得された点群という3種類に分けることができる。第一の種類の静的な点群では、物体が静止であり、点群取得装置も静止である。第二の種類の動的な点群では、物体が動的であるが、点群取得装置が静止である。第三の種類の動的に取得された点群では、点群取得装置が動的である。
【0019】
例えば、医学分野において、磁気共鳴画像法(magnetic resonance imaging、MRI)、コンピュータ断層撮影(computed tomography、CT)、電磁定位情報(electromagnetic localization information)によって、生物組織器官の点群を得ることができる。これらの技術は、点群の取得コスト及び時間周期を低減し、データの精度を向上させる。点群の取得方法の変革は、大量の点群の取得を可能にする。大規模な点群の継続的な蓄積に伴い、点群の効率的な記憶、伝送、公開、共有及び標準化が点群の応用の鍵となる。
【0020】
点群データは、点群メディアを形成するために用いられることができ、点群メディアは、メディアファイルであってもよい。点群メディアは、複数のメディアフレームを含んでもよく、点群メディアにおける各メディアフレームは、点群データから構成される。点群メディアは、三次元物体又は三次元シーンの空間構造及び表面属性を柔軟かつ簡便に表現することができるため、広く用いられている。点群メディアを符号化した後、符号化されたビットストリームをカプセル化してカプセル化ファイルを形成し、カプセル化ファイルは、ユーザに伝送されるため用いられることができる。それに応じて、点群メディアプレーヤー側では、カプセル化ファイルをデカプセル化して復号化し、最終的に復号化されたデータフローを呈することができる。カプセル化ファイルは、点群ファイルと呼ばれることもできる。
【0021】
現在まで、点群符号化フレームワークにより点群を符号化することができる。
【0022】
点群符号化フレームワークは、動画像専門家グループ(moving picture experts group、MPEG)によって提供される、幾何に基づいた点群圧縮(geometry point cloud compression、G-PCC)符号化・復号化フレームワーク、又はビデオに基づいた点群圧縮(video point cloud compression、V-PCC)符号化・復号化フレームワークであることができ、オーディオビデオ符号化規格(audio video standard、AVS)によって提供されるAVS-PCC符号化・復号化フレームワークであることもできる。G-PCC符号化・復号化フレームワークは、第一種類の静的な点群及び第三の種類の動的に取得された点群の圧縮に用いられることができ、V-PCC符号化・復号化フレームワークは、第二の種類の動的な点群の圧縮に用いられることができる。G-PCC符号化・復号化フレームワークは、点群符号器・復号器TMC13とも呼ばれ、V-PCC符号化・復号化フレームワークは、点群符号器・復号器TMC2とも呼ばれる。以下、本出願の実施形態に適用可能な符号化・復号化フレームワークについて、G-PCC符号化・復号化フレームワークで説明する。
【0023】
図1は、本出願の実施形態に係る符号化フレームワーク100を示すブロック図である。
【0024】
図1に示されるように、符号化フレームワーク100は、収集デバイスから点群の位置情報及び属性情報を取得することができる。点群の符号化は、位置符号化及び属性符号化を含む。1つの実施形態において、位置符号化のプロセスは、オリジナル点群に対して座標変換や量子化・重複点除去などの前処理を行うことと、八分木を構築した後に符号化を行い、幾何ビットストリームを形成することと、を含む。属性符号化プロセスは、入力点群の位置情報の再構成情報及び属性情報の真値を与え、3つの予測モードのうちの1つを選択して点群予測を行い、予測後の結果を量子化し、算術符号化を行うことにより、属性ビットストリームを形成することを含む。
【0025】
図1に示されるように、位置符号化は、座標変換(coordinate transform)ユニット101、量子化・重複点除去(quantization and repetition point removal)ユニット102、八分木分析(octree analysis)ユニット103、幾何再構成(geometry reconstruction)ユニット104、及び第一算術符号化(first arithmetic encoding)ユニット105によって実現され得る。
【0026】
座標変換ユニット101は、点群における点のワールド座標を相対座標に変換するために用いられることができる。例えば、点の幾何座標からxyz座標軸の最小値をそれぞれ減算すること(直流除去操作に相当する)により、点群における点の座標をワールド座標から相対座標に変換することを実現する。量子化・重複点除去102は、量子化により座標の数を減らすことができ、量子化後、元の異なる点に同じ座標が与えられる可能性があるため、重複点を重複除外操作により削除することができる。例えば、同じ量子化位置及び異なる属性情報を有する複数の点を属性変換により1つの点にマージすることができる。本出願のいくつかの実施形態において、量子化・重複点除去ユニット102は、選択可能なユニットモジュールである。八分木分析ユニット103は、量子化された点の位置情報を八分木(octree)符号化方式で符号化することができる。例えば、点群を八分木の形式で分割することで、点の位置は八分木の点の位置と一対一で対応することができ、八分木にノードがある位置を統計し、そのフラグ(flag)を1として記し、幾何符号化を行う。第一算術符号化ユニット105は、エントロピー符号化方式を利用して、八分木分析ユニット103から出力された位置情報に対して算術符号化を行うことができ、即ち、八分木分析ユニット103から出力された位置情報を利用して算術符号化方式で幾何ビットストリーム(geometry bitstream)を生成する。幾何ビットストリームは、幾何コードストリームと呼ばれてもよい。
【0027】
属性符号化は、色空間変換(color transform)ユニット110、属性変換(attribute transfer)ユニット111、RAHT(region adaptive hierarchical transform)ユニット112、予測変換(predicting transform)ユニット113、及びリフティング変換(lifting transform)ユニット114、量子化ユニット115及び第二算術符号化ユニット116によって実現され得る。
【0028】
色空間変換ユニット110は、点群における点のRGB色空間をYCbCrフォーマット又は他のフォーマットに変換するために用いられることができる。属性変換ユニット111は、属性の歪みを最小にするように、点群における点の属性情報を変換するために用いられることができる。例えば、属性変換ユニット111は、点の属性情報の真値を取得するために用いられることができる。例えば、属性情報は、点の色情報であってもよい。属性変換ユニット111の変換により点の属性情報の真値が得られた後、任意の予測ユニットを選択して、点群における点を予測することができる。点群における点を予測するために用いられるユニットは、RAHTユニット112、予測変換ユニット113、及びリフティング変換ユニット114のうちの少なくとも1つを含むことができる。換言すれば、RAHTユニット112、予測変換ユニット113、及びリフティング変換ユニット114のいずれかは、点群における点の属性情報を予測して当該点の属性情報の予測値を取得し、さらに、当該点の属性情報の予測値に基づいて当該点の属性情報の残差値を取得するために用いられることができる。例えば、点の属性情報の残差値は、点の属性情報の真値から点の属性情報の予測値を差し引いた値であってもよい。
【0029】
予測変換ユニット113は、後続の量子化符号化が行われるように、詳細レベル(level of detail、LOD)を生成し、LODにおける点の属性情報を順次予測し、予測残差を計算するために用いられることができる。具体的に、LODにおける各点について、前のLODにおいて距離が最も近い3つの近傍点を見つけ、3つの近傍点の再構成値を利用して現在点(current point)を予測して予測値を得る。上記に踏まえて、現在点の予測値及び現在点の真値に基づいて、現在点の残差値を得ることができる。例えば、残差値は以下の式に基づいて求められることができる。
【数1】
ここで、attrResidualQuantは現在点の残差値を表し、attrPredは現在点の予測値を表し、attrValueは現在点の真値を表し、Qstepは量子化ステップサイズを表す。Qstepは、量子化パラメータ(quantization parameter、Qp)から計算される。
【0030】
現在点は後続点の最近の近傍点とされ、現在点の再構成値は、後続点の属性情報の予測に用いられる。現在点の属性情報の再構成値は、以下の式で得られることができる。
【数2】
ここで、reconstructedColorは現在点の再構成値を表し、attrResidualQuantは現在点の残差値を表し、Qstepは量子化ステップサイズを表し、attrPredは現在点の予測値を表す。Qstepは、量子化パラメータ(Qp)から計算される。
【0031】
LODの生成プロセスは、点群における点の位置情報に基づいて点と点の間のユークリッド距離を取得することと、ユークリッド距離に基づいて点を異なるLOD層に分割することとを含む。1つの実施形態において、ユークリッド距離を順位付けした後、異なる範囲にあるユークリッド距離に対応する点を異なるLOD層に分割することができる。例えば、1つの点を任意に選んで第一LOD層とする。そして、残りの点とその点との間のユークリッド距離を計算し、ユークリッド距離が第一閾値を満たす点を第二LOD層に分類する。第二LOD層における点の質量中心を取得し、第一LOD層及び第二LOD層以外の点と該質量中心との間のユークリッド距離を計算し、ユークリッド距離が第二閾値を満たす点を第三LOD層に分類する。全ての点をLOD層に分類するまで、上記の操作を順次類推する。ユークリッド距離の閾値を調整することにより、各LOD層における点の数が増えていくようにすることができる。LOD層の分割方法としては、他の方法が採用されてもよく、本出願では、それについては限定されない。なお、点群を1つ又は複数のLOD層に直接に分割することができ、点群をまず複数の点群スライス(slice)に分割し、次に、各点群スライスを1つ又は複数のLOD層に分割することもできる。例えば、点群を複数の点群スライスに分割することができ、各点群スライスにおける点の数は55万~110万であることができる。各点群スライスはそれぞれ単独の点群と見なされることができる。各点群スライスは複数のLOD層に分割されることができ、各LOD層は複数の点を含む。1つの実施形態において、点と点の間のユークリッド距離に応じて、LOD層の分割を行うことができる。
【0032】
図2は、本出願の実施形態に係る詳細レベル(LOD)層を示すブロック図である。
【0033】
図2に示されるように、点群は、オリジナル順序(original order)に並んだ複数の点、即ちP0、P1、P2、P3、P4、P5、P6、P7、P8及びP9を含むと仮定し、点と点の間のユークリッド距離に基づいて、点群を3つのLOD層、即ちLOD0、LOD1及びLOD2に分割することができると仮定する。LOD0はP0、P5、P4及びP2を含み、LOD2はP1、P6及びP3を含み、LOD3はP9、P8及びP7を含むことができる。この場合、LOD0、LOD1及びLOD2は、当該点群の、LODに基づいた順序(LOD-based order)(即ちP0、P5、P4、P2、P1、P6、P3、P9、P8及びP7)を形成するために用いられることができる。LODに基づいた順序は、当該点群の符号化順とされることができる。
【0034】
量子化ユニット115は、点の属性情報の残差値を量子化するために用いられることができる。例えば、量子化ユニット115と予測変換ユニット113とが接続されている場合、量子化ユニットは、予測変換ユニット113から出力された点の属性情報の残差値を量子化するために用いられることができる。例えば、予測変換ユニット113から出力された点の属性情報の残差値を量子化ステップサイズで量子化することにより、システム性能の向上を図る。第二算術符号化ユニット116は、ゼロランレングス符号化(zero run length coding)を利用して点の属性情報の残差値をエントロピー符号化することにより、属性ビットストリームを得ることができる。属性ビットストリームは、ビットストリーム情報であってもよい。
【0035】
なお、本出願の実施形態において、点群における点の属性情報の予測値(predicted value)は、LODモードにおける色予測値(predicted color)と呼ばれることもできる。点の残差値(residual value)は、点の属性情報の真値から点の属性情報の予測値を差し引くことで得られる。点の属性情報の残差値は、LODモードにおける色残差値(residual color)と呼ばれることもできる。点の属性情報の予測値と点の属性情報の残差値とを加算して、点の属性情報の再構成値(reconstructed value)を生成する。点の属性情報の再構成値は、LODモードにおける色再構成値(reconstructed color)と呼ばれることもできる。
【0036】
図3は、本出願の実施形態に係る復号化フレームワーク200を示すブロック図である。
【0037】
図3に示されるように、復号化フレームワーク200は、符号化装置から点群のビットストリームを取得し、ビットストリームを解析することによって点群における点の位置情報及び属性情報を取得することができる。点群の復号化は、位置復号化及び属性復号化を含む。1つの実施形態において、位置復号化のプロセスは、幾何ビットストリームに対して算術復号化を行うことと、八分木を構築した後に統合を行い、点の位置情報を再構成することにより、点の位置情報の再構成情報を得ることと、点の位置情報の再構成情報に対して座標変換を行うことにより点の位置情報を得ることとを含む。点の位置情報は、点の幾何情報と呼ばれることもできる。
【0038】
属性復号化のプロセスは、属性ビットストリームを解析することにより、点群における点の属性情報の残差値を得ることと、点の属性情報の残差値に対して逆量子化を行うことにより、逆量子化後の点の属性情報の残差値を得ることと、位置復号化中に得られた点の位置情報の再構成情報に基づいて、3つの予測モードのうちの1つを選択して点群予測を行うことにより、予測値を得ることと、予測値及び残差値に基づいて点の属性情報の再構成値を得ることと、点の属性情報の再構成値に対して色空間逆変換を行うことにより、復号化された点群を得ることと、を含む。
【0039】
図3に示されるように、位置復号化は、第一算術復号化(first arithmetic decoding)ユニット201、八分木合成(octree synthesization)ユニット202、幾何再構成ユニット203、及び座標逆変換(coordinate inverse transform)ユニット204により実現され得る。属性復号化は、第二算術復号化ユニット210、逆量子化(inverse quantization)ユニット211、RAHTユニット212、予測変換ユニット213、リフティング変換ユニット214、及び色空間逆変換(color inverse transform unit)ユニット215によって実現され得る。
【0040】
なお、圧縮解除は圧縮の逆過程であり、同様に、復号化フレームワーク200における各ユニットの機能については、符号化フレームワーク100における対応のユニットの機能を参照することができる。例えば、復号化フレームワーク200において、点群における点と点の間のユークリッド距離に応じて点群を複数のLODに分割し、次に、LODにおける点の属性情報を順次復号化することができる。例えば、ゼロランレングス符号化技術におけるゼロの数(zero_cnt)を計算し、ゼロの数に基づいて残差値を復号化し、次に、復号化フレームワーク200において、全ての点が復号化されるまで、復号化された残差値に基づいて逆量子化を行い、逆量子化後の残差値と、現在点の予測値とを加算することにより当該点の再構成値を得ることができる。ゼロランレングス符号化技術に基づいて復号化操作が行われる。まず、ビットストリームにおける1番目のzero_cntのサイズが取得される。zero_cntが0より大きい場合、この点の属性情報の残差値が0であることが示される。zero_cntが0ではない場合、この点の属性情報の残差値が0ではないことが示される。残差値が0である場合、第一解析関数を利用して残差値を解析し、残差値が0ではない場合、第二解析関数を利用して残差値を解析する。現在点はLODにおける後続点の最近の近傍点とされ、現在点の再構成値を利用して後続点の属性情報が予測される。また、逆変換及び逆量子化(スケーリングとも呼ばれる)については、直交変換では、一方の行列が変換に用いられる場合、他方の行列が逆変換に用いられる。復号化方法では、復号器に使用される行列は、「変換」(transform)行列と呼ばれることができる。
【0041】
本出願の実施形態において、点群復号化方法、点群符号化方法、復号器及び符号器が提供され、それによって、点群復号化のプロセスにおける再構成の精度を向上させ、さらに復号化効果を高めることができる。
【0042】
図4は、本出願の実施形態に係る点群復号化方法300の例示的なフローチャートを示している。点群復号化方法300は、復号側によって実行されることができ、例えば、
図3に示された復号化フレームワーク200、即ち点群復号器TMC13によって実行され得る。説明の便宜のため、復号器を実行主体として、本出願の技術的解決策を以下に説明する。
【0043】
図4に示されるように、復号化方法300は、以下の内容を含むことができる。
【0044】
S301:点群のビットストリームを解析することにより、点群における1つの目標点の属性情報の初期再構成値を得る。
【0045】
S302:初期再構成値を初期輝度値及び初期彩度値に変換する。
【0046】
S303:カルマンフィルタリングアルゴリズムを利用して初期彩度値をフィルタリングすることにより、最終彩度値を得る。
【0047】
S304:最終彩度値及び初期輝度値に基づいて、目標点の属性情報の最終再構成値を得る。
【0048】
S305:目標点の属性情報の最終再構成値に基づいて、復号化された点群を得る。
【0049】
具体的に、初期再構成値はRGBフォーマットを有する値であることができ、例えば、初期再構成値Fは、異なるコンポーネントR、G、Bを混合することにより得られることができ、即ち、F=r[R]+g[G]+b[B]であり、r、g、bはそれぞれ三原色の混合の係数である。三原色コンポーネントがすべて0である(最も弱い)場合、混合色は黒となり、三原色コンポーネントがすべてkである(最も強い)場合、混合色は白となる。r、g、bという3つの係数の値を調整することにより、黒と白の間の様々な混合色を得ることができる。RGBは色空間変換により輝度値(即ち、輝度信号Y)及び彩度値(即ち、彩度信号(chroma signal)Crと彩度信号Cb)に変換されることができる。彩度値及び輝度値を含む色空間は、いわゆるYCbCr色空間である。本出願の実施形態では、変換後のオリジナル彩度値に対してカルマンフィルタリングを行うことにより、復号化効果を高める。
【0050】
本出願に係る解決策では、初期再構成値を初期輝度値及び初期彩度値に変換し、カルマンフィルタリングアルゴリズムを利用して初期彩度値のみをフィルタリングすることにより、目標点の属性情報の再構成の精度を向上させることができ、点の再構成プロセスの品質を向上させることができ、それに対応して、点群復号化の復号化効果を高めることができる。さらに、カルマンフィルタリングアルゴリズムは定常信号の処理により適しており、点群の輝度値は変動が大きいため、カルマンフィルタリングアルゴリズムを利用して初期彩度値のみをフィルタリングすることで、フィルタリング効果を高め、点群復号化の復号化効果をより高めることができる。
【0051】
本出願に係る技術的解決策に基づいて、G-PCC参照ソフトウェアTMC13 V11.0でテストを行い、CTC CYテスト条件で、MPEGによって要求される一部のテストシーケンスをテストする。テストの結果は下記表1に示されている。以下、表1を参照しながら性能向上効果を説明する。
【0052】
【0053】
【0054】
【0055】
なお、本出願の実施形態におけるカルマンフィルタリングのプロセスは、復号器の後処理のプロセス又はループ内のフィルタリング処理のプロセスと組み合わせてもよく、本出願の実施形態では、それについては具体的に限定されない。なお、本出願に係る点群は、完全な点群であってもよく、完全な点群を分割して形成した点群スライス(slice)であってもよい。
【0056】
図5は、本出願の実施形態に係るカルマンフィルタリングの原理を示す概略図である。
【0057】
図5に示されるように、目標点の属性情報の初期彩度値は、曲線371によって表され、目標点の属性情報の最終彩度値は、曲線372によって表され、目標点の属性情報の測定値は、曲線373によって表されることができる。換言すれば、目標点の属性情報の測定値を利用して目標点の属性情報の初期彩度値をフィルタリングすることにより、目標点の属性情報の最終彩度値を得ることができる。初期彩度値は、事前推定値(priori estimate)と呼ばれることもでき、最終彩度値は、最適推定値又は事後推定値(posteriori estimate)と呼ばれることもできる。例えば、点群における目標点に対するカルマンフィルタリングを予測プロセス及び補正プロセスに分けることができる。目標点が点群におけるk番目の点であると仮定し、予測プロセスにおいて、(k-1)番目の点の初期彩度値に基づいてk番目の点の状態を推定して、k番目の点の測定値を取得し、補正プロセスにおいて、k番目の点の測定値を利用してk番目の点の初期彩度値を補正して、k番目の点の最終彩度値を取得する。
【0058】
本出願のいくつかの実施形態において、上記S303は以下の内容を含むことができる。目標点の前の1つ又は複数の点の属性情報の再構成値の彩度値を測定値とし、カルマンフィルタリングアルゴリズムを利用して初期彩度値をフィルタリングすることにより、最終彩度値を得る。
【0059】
例えば、目標点の前の1つ又は複数の点の属性情報の再構成値は、目標点の前の1つの点の属性情報の再構成値であってもよい。別の例として、目標点の前の1つ又は複数の点の属性情報の再構成値は、目標点の前の複数の点の属性情報の再構成値の平均値、最大値又は最小値であってもよい。例えば、目標点の前の1つ又は複数の点の属性情報の初期再構成値の彩度値を測定値とし、カルマンフィルタリングアルゴリズムを利用して初期彩度値をフィルタリングすることにより、最終彩度値を得る。別の例として、目標点の前の1つ又は複数の点の属性情報の最終再構成値の彩度値を測定値とし、カルマンフィルタリングアルゴリズムを利用して初期彩度値をフィルタリングすることにより、最終彩度値を得る。選択的に、目標点の前の1つ又は複数の点は、復号化順に基づいて目標点の前に位置する1つ又は複数の点である。もちろん、目標点の前の1つ又は複数の点は、他の順序に基づいて確定された1つ又は複数の点であってもよい。なお、目標点の前の1つ又は複数の点は、目標点が位置するLOD層における、目標点の前の1つ又は複数の点であると理解されてもよく、符号順に基づいて目標点の前に位置する1つ又は複数の点であると理解されてもよい。
【0060】
要するに、復号器は、再構成値の彩度値を測定値として利用し、カルマンフィルタリングアルゴリズムを利用して初期彩度値をフィルタリングして、最終彩度値を得る。
【0061】
例として、上記S303は以下の内容を含むことができる。目標点の前の1つ又は複数の点の属性情報の再構成値の平均再構成値を計算する。平均再構成値を平均輝度値及び平均彩度値に変換する。平均彩度値を測定値とし、カルマンフィルタリングアルゴリズムを利用して初期彩度値をフィルタリングすることにより、最終彩度値を得る。
【0062】
もちろん、上述したように、平均彩度値を測定値とすることは、本出願において提供される単なる例であり、本出願を限定するものであると解釈されるべきではない。
【0063】
本出願のいくつかの実施形態において、目標点の属性情報の残差値は、複数の量子化ステップサイズのうちの目標量子化ステップサイズに基づいて逆量子化を行うことにより得られる。上記S302は以下の内容を含むことができる。目標量子化ステップサイズが閾値N以上である場合、初期再構成値を初期輝度値及び初期彩度値に変換し、Nは非負整数である。選択的に、複数の量子化ステップサイズは昇順にソートされ、Nは複数の量子化ステップサイズのうちのn番目の量子化ステップサイズの値であり、nは正整数である。
【0064】
換言すれば、比較的に大きい量子化ステップに基づいて逆量子化を行うとき、初期再構成値を初期輝度値及び初期彩度値に変換する。
【0065】
5つのビットレートに対応する5つの量子化ステップサイズが存在すると仮定する。比較的に大きい後の3つの量子化ステップサイズ(即ち、目標量子化ステップサイズ)のみに対してカルマンフィルタリング処理を行い、前の2つの量子化ステップサイズに対して何の処理も行わないと仮定する。量子化ステップサイズが大きければ大きいほど、点の属性情報の再構成値と点の属性情報の真値との間の誤差が大きくなり、点の属性情報の再構成値の品質も悪くなる。それに基づいて、前の2つの量子化ステップサイズに対してカルマンフィルタリング処理を行っても、点の属性情報の再構成値の誤差が小さいため、フィルタリングの効果が良くない。比較的に大きい後の3つの量子化ステップサイズのみに対してカルマンフィルタリング処理を行う場合、点の属性情報の再構成値のフィルタリングの効果がよく、フィルタリングのプロセスを簡略化することができるだけでなく、復号化効果を保証することもできる。
【0066】
本出願のいくつかの実施形態において、上記S302は以下の内容を含むことができる。色空間変換関数を利用して初期再構成値を初期輝度値及び初期彩度値に変換する。初期輝度値及び初期彩度値は、ディスプレイスクリーンによってサポートされる色空間内に位置する。選択的に、色空間変換関数は、transformGbrToYCbCrBt709であってもよい。選択的に、色空間は色域空間と呼ばれることもできる。
【0067】
もちろん、本出願は、色空間変換関数を利用して、初期再構成値を、ディスプレイスクリーンによってサポートされる色空間又は色域空間内に変換することを保護しようとし、具体的な変換関数については、本出願の実施形態では限定されない。例えば、ディスプレイスクリーンの属性に応じて異なる変換関数を利用することができ、さらに、異なる符号化・復号化規格に係る色空間又は色域空間に基づいて異なる変換関数を利用することもできる。
【0068】
本出願のいくつかの実施形態において、上記S301は、以下の内容を含むことができる。点群における1つのLOD層における点の数が閾値Mより小さい場合、LOD層における各点に対して、可逆符号化された点の属性情報の残差値及び点の属性情報の予測値に基づいて、点の属性情報の初期再構成値を得る。点群における1つのLOD層における点の数が閾値M以上である場合、LOD層における(m*M)番目の点に対して、可逆符号化された点の属性情報の残差値及び点の属性情報の予測値に基づいて、点の属性情報の初期再構成値を得る。Mは1より大きい正の整数であり、mは0以上の正の整数である。
【0069】
LOD層における、符号化順では前に位置する点に対して、ユークリッド距離が大きいため、量子化プロセスにおいて比較的に大きい量子化誤差が生じてしまう可能性がある。一部の点の属性情報の残差値が量子化されず、その一部の点の属性情報の再構成値が真値であることに相当し、結果として、点群における全ての点の属性情報の再構成値の精度が向上することができる。同時に、再構成値の精度が向上することに連れて、カルマンフィルタリングの更新・イテレーション(iteration)のプロセスの精度をさらに向上させ、復号化効果を一層高めることができる。復号器は、同じ位置にある点に対して逆量子化を行わず、正しく、より品質の良い再構成値を取得することができる。
【0070】
選択的に、上記方法300は以下の内容をさらに含むことができる。ビットストリームを解析することにより、ビットストリームにおける、属性情報の残差値が逆量子化を必要としない点の数を得る。
【0071】
本出願のいくつかの実施形態において、上記S301は以下の内容を含むことができる。点群における1つのLOD層における点の数が閾値Tより小さい場合、LOD層における各点に対して、点の属性情報の最終再構成値を当該点の属性情報の真値に置き換える。点群における1つのLOD層における点の数が閾値T以上である場合、LOD層における(t*T)番目の点の属性情報の最終再構成値を当該点の属性情報の真値に置き換える。Tは1より大きい正の整数であり、tは0以上の正の整数である。
【0072】
LOD層における、符号化順では前に位置する点群に対して、ユークリッド距離が大きいため、量子化プロセスにおいて比較的に大きい量子化誤差が生じてしまう可能性がある。一部の点の最終再構成値を真値に置き換えることにより、点群における全ての点の属性情報の再構成値の精度が向上することができる。同時に、再構成値の精度が向上することに連れて、カルマンフィルタリングの更新・イテレーションのプロセスの精度をさらに向上させ、復号化効果を一層高めることができる。復号器は、同じ位置にある点に対して真値を採用することにより、正しく、より品質の良い再構成値を取得することができる。
【0073】
選択的に、上記方法300は以下の内容をさらに含むことができる。ビットストリームを解析することにより、ビットストリームにおける、属性情報の最終再構成値が真値である点の数と、点の属性情報の真値とを得る。
【0074】
本出願のいくつかの実施形態において、上記方法300は以下の内容をさらに含むことができる。点群を1つ又は複数のLOD層に分割する。各LOD層は1つ又は複数の点を含む。
【0075】
本出願のいくつかの実施形態において、上記S301は以下の内容を含むことができる。ビットストリームを解析することにより、目標点の位置情報の再構成情報を得る。目標点の位置情報の再構成情報に基づいて、目標点の属性情報の予測値を得る。ビットストリームを解析することにより、目標点の属性情報の残差値を得る。目標点の属性情報の予測値及び目標点の属性情報の残差値に基づいて、目標点の属性情報の初期再構成値を得る。
【0076】
図6は、本出願の実施形態に係る復号化方法を示す別の概略図である。
【0077】
図6に示されるように、5つのビットレートに対応する5つの量子化ステップサイズ(即ち、Qp1、Qp2、Qp3、Qp4及びQp5)が存在すると仮定する。後の3つの量子化ステップサイズ(即ち、Qp3、Qp4及びQp5)が閾値N以上であり、即ち、比較的に大きい後の3つの量子化ステップサイズ(即ち、Qp3、Qp4及びQp5)のみに対してカルマンフィルタリング処理を行い、前の2つの量子化ステップサイズに対して何の処理も行わないと仮定する。それに基づいて、LODの生成順序に基づいて、各点の再構成値に対して順次にカルマンフィルタリング操作を行うことができる。
【0078】
具体的に、符号器は、点群をトラバースすることで、点群における現在点の属性情報の初期再構成値(RGB値)を取得し、復号器は、現在点の前の3つの点の属性情報の再構成値の平均再構成値を計算する。そして、復号器は、関数transformGbrToYCbCrBt709を利用して、現在点の初期再構成値と前の3つの点の再構成値の平均再構成値とをRGBドメインからYUVドメインに変換することができ、即ち、符号器は、平均再構成値の平均彩度値と平均輝度値、及び現在点の初期彩度値と初期輝度値を得る。次に、復号器は、得られた平均彩度値を測定値とし、初期彩度値を予測値としてカルマンフィルタリングを行い、現在点の最終彩度値を得て、さらに現在点の最終彩度値と初期輝度値とに基づいて最終再構成値を得る。換言すれば、YUVコンポーネントのUVコンポーネントがカルマンフィルタリングに必要な入力パラメータとされ、即ち測定値とされ、現在点のYUVコンポーネントのUVコンポーネントがカルマンフィルタリングの別の入力パラメータとされ、即ち予測値とされる。カルマンフィルタリングが終了した後、フィルタリング後の最終再構成値は現在点の初期再構成値をカバーする。
【0079】
本実施形態において、比較的に大きい量子化ステップサイズを選択した場合、初期彩度値のみに対してカルマンフィルタリング処理を行う。それによって、初期輝度値の品質損失を回避し、フィルタリング性能を向上させることができる。
【0080】
図7は、本出願の実施形態に係る点群符号化方法400を示すフローチャートである。当該方法400は、符号化側によって実行されることができ、例えば、
図2に示された符号化フレームワーク100又は符号器によって実行され得る。
【0081】
図7に示されるように、当該方法400は、以下の内容を含むことができる。
【0082】
S401:点群における1つの目標点の位置情報を処理することにより、目標点の位置情報の再構成情報を得る。
【0083】
S402:目標点の位置情報の再構成情報に基づいて、目標点の属性情報の予測値を得る。
【0084】
S403:点群における目標点の属性情報を処理することにより、目標点の属性情報の真値を得る。
【0085】
S404:目標点の属性情報の予測値及び目標点の属性情報の真値に基づいて、目標点の属性情報の残差値を得る。
【0086】
S405:ビットストリームに書き込まれる必要がある、可逆符号化された点の属性情報の残差値の数と目標点の属性情報の残差値とを符号化することにより、ビットストリームを得る。
【0087】
本出願のいくつかの実施形態において、上記S405は、以下の内容を含むことができる。点群における1つのLOD層における点の数が閾値Mより小さい場合、LOD層における各点に対して、逆量子化されていない点の属性情報の残差値を符号化することにより、ビットストリームを得る。点群における1つのLOD層における点の数が閾値M以上である場合、LOD層における(m*M)番目の点に対して、逆量子化されていない点の属性情報の残差値を符号化することにより、ビットストリームを得る。Mは1より大きい正の整数であり、mは0以上の正の整数である。
【0088】
具体的に、符号器は、点群における1つの目標点の位置情報を処理することにより、目標点の位置情報の再構成情報を得る。符号器は、目標点の位置情報の再構成情報に基づいて、目標点の属性情報の予測値を得る。符号器は、点群における目標点の属性情報を処理することにより、目標点の属性情報の真値を得る。符号器は、目標点の属性情報の予測値及び目標点の属性情報の真値に基づいて、目標点の属性情報の残差値を得る。符号器は、目標点の属性情報の残差値を符号化することにより、ビットストリームを得る。選択的に、さらに、符号器は、属性情報の残差値を量子化することを必要としない点の数を符号化することができる。例えば、点群における1つのLOD層における点の数が閾値Mより小さい場合、LOD層における各点に対して、符号器は、逆量子化されていない点の属性情報の残差値を符号化することにより、ビットストリームを得る。点群における1つのLOD層における点の数が閾値M以上である場合、LOD層における(m*M)番目の点に対して、逆量子化されていない点の属性情報の残差値を符号化することにより、ビットストリームを得る。Mは1より大きい正の整数であり、mは0以上の正の整数である。
【0089】
本出願のいくつかの実施形態において、上記方法400は以下の内容を含むことができる。点群を1つ又は複数のLOD層に分割する。各LOD層は1つ又は複数の点を含む。
【0090】
以上、添付図面を参照しながら本出願の好適な実施形態について詳細に説明したが、本出願は上記実施形態の詳細な内容に限定されるものではなく、本出願の技術的思想の範囲内において、本出願の技術的解決策に様々な簡単な変更を加えることが可能であり、それらの簡単な変更はいずれも本出願の保護範囲に属する。例えば、上記具体的な実施形態で述べられた各具体的な技術的特徴は、矛盾のない場合、いかなる適当な手段により組み合わせてもよく、不要な重複を避けるために、本出願では様々な可能な組合せについて改めて説明しない。また、例えば、本出願の様々な異なる実施形態間において、本出願の思想に反しない限り、いかなる組合せであっても本出願に開示されるものとみなされるべきである。なお、本出願の様々な方法実施形態において、上記各プロセスのシーケンス番号の大きさは、実行順序を意味するものではないことを理解されたい。各プロセスの実行順序は、その機能及び内部論理によって確定されるべきであり、本出願の実施態様の実施過程に対するいかなる制限を構成すべきではない。
【0091】
以下、本出願の実施形態に係る点群符号器又は点群復号器について、添付図面を参照しながらに説明する。
【0092】
図8は、本出願の実施形態に係る復号器500を示すブロック図である。
【0093】
図8に示されるように、復号器500は解析ユニット501、変換ユニット502、フィルタリングユニット503、第一処理ユニット504、及び第二処理ユニット505を含む。解析ユニット501は、点群のビットストリームを解析することにより、点群における1つの目標点の属性情報の初期再構成値を得るように構成されている。変換ユニット502は、初期再構成値を初期輝度値及び初期彩度値に変換するように構成されている。フィルタリングユニット503は、カルマンフィルタリングアルゴリズムを利用して初期彩度値をフィルタリングすることにより、最終彩度値を得るように構成されている。第一処理ユニット504は、最終彩度値及び初期輝度値に基づいて、目標点の属性情報の最終再構成値を得るように構成されている。第二処理ユニット505は、目標点の属性情報の最終再構成値に基づいて、復号化された点群を得るように構成されている。
【0094】
本出願のいくつかの実施形態において、フィルタリングユニット503は具体的に、目標点の前の1つ又は複数の点の属性情報の再構成値の平均再構成値を計算し、平均再構成値を平均輝度値及び平均彩度値に変換し、平均彩度値を測定値とし且つカルマンフィルタリングアルゴリズムを利用して初期彩度値をフィルタリングすることにより、最終彩度値を得るように構成されている。
【0095】
本出願のいくつかの実施形態において、目標点の前の1つ又は複数の点は、復号化順に基づいて目標点の前に位置する1つ又は複数の点である。
【0096】
本出願のいくつかの実施形態において、目標点の属性情報の残差値は、複数の量子化ステップサイズのうちの目標量子化ステップサイズに基づいて逆量子化を行うことにより得られる。変換ユニット502は具体的に、目標量子化ステップサイズが閾値N以上である場合、初期再構成値を初期輝度値及び初期彩度値に変換するように構成されている。Nは非負整数である。
【0097】
本出願のいくつかの実施形態において、複数の量子化ステップサイズは昇順にソートされ、Nは複数の量子化ステップサイズのうちのn番目の量子化ステップサイズの値であり、nは正の整数である。
【0098】
本出願のいくつかの実施形態において、変換ユニット502は具体的に、色空間変換関数を利用して初期再構成値を初期輝度値及び初期彩度値に変換するように構成されている。初期輝度値及び初期彩度値は、ディスプレイスクリーンによってサポートされる色空間内に位置する。
【0099】
本出願のいくつかの実施形態において、解析ユニット501は具体的に、点群における1つのLOD層における点の数が閾値Mより小さい場合、LOD層における各点に対して、可逆符号化された点の属性情報の残差値及び点の属性情報の予測値に基づいて、点の属性情報の初期再構成値を得、又は、点群における1つのLOD層における点の数が閾値M以上である場合、LOD層における(m*M)番目の点に対して、可逆符号化された点の属性情報の残差値及び点の属性情報の予測値に基づいて、点の属性情報の初期再構成値を得るように構成されている。Mは1より大きい正の整数であり、mは0以上の正の整数である。
【0100】
本出願のいくつかの実施形態において、解析ユニット501はさらに、ビットストリームを解析することにより、ビットストリームにおける、属性情報の残差値が逆量子化を必要としない点の数を得るように構成されている。
【0101】
本出願のいくつかの実施形態において、解析ユニット501は具体的に、点群における1つのLOD層における点の数が閾値Tより小さい場合、LOD層における各点に対して、点の属性情報の最終再構成値を当該点の属性情報の真値に置き換え、又は、点群における1つのLOD層における点の数が閾値T以上である場合、LOD層における(t*T)番目の点の属性情報の最終再構成値を当該点の属性情報の真値に置き換えるように構成されている。Tは1より大きい正の整数であり、tは0以上の正の整数である、
【0102】
本出願のいくつかの実施形態において、解析ユニット501はさらに、ビットストリームを解析することにより、ビットストリームにおける、属性情報の最終再構成値が真値である点の数と、点の属性情報の真値とを得るように構成されている。
【0103】
本出願のいくつかの実施形態において、解析ユニット501はさらに、点群を1つ又は複数のLOD層に分割するように構成されている。各LOD層は1つ又は複数の点を含む。
【0104】
本出願のいくつかの実施形態において、解析ユニット501は具体的に、ビットストリームを解析することにより、目標点の位置情報の再構成情報を得、目標点の位置情報の再構成情報に基づいて、目標点の属性情報の予測値を得、ビットストリームを解析することにより、目標点の属性情報の残差値を得、目標点の属性情報の予測値及び目標点の属性情報の残差値に基づいて、目標点の属性情報の初期再構成値を得るように構成されている。
【0105】
図9は、本出願の実施形態に係る点群符号器600を示すブロック図である。
【0106】
図9に示されるように、符号器600は、第一処理ユニット601、第二処理ユニット602、第三処理ユニット603、第四処理ユニット604、及び符号化ユニット605を含む。第一処理ユニット601は、点群における1つの目標点の位置情報を処理することにより、目標点の位置情報の再構成情報を得るように構成されている。第二処理ユニット602は、目標点の位置情報の再構成情報に基づいて、目標点の属性情報の予測値を得るように構成されている。第三処理ユニット603は、点群における目標点の属性情報を処理することにより、目標点の属性情報の真値を得るように構成されている。第四処理ユニット604は、目標点の属性情報の予測値及び目標点の属性情報の真値に基づいて、目標点の属性情報の残差値を得るように構成されている。符号化ユニット605は、ビットストリームに書き込まれる必要がある、可逆符号化された点の属性情報の残差値の数と目標点の属性情報の残差値とを符号化することにより、ビットストリームを得るように構成されている。
【0107】
本出願のいくつかの実施形態において、符号化ユニット605は具体的に、点群における1つのLOD層における点の数が閾値Mより小さい場合、LOD層における各点に対して、逆量子化されていない点の属性情報の残差値を符号化することにより、ビットストリームを得、又は、点群における1つのLOD層における点の数が閾値M以上である場合、LOD層における(m*M)番目の点に対して、逆量子化されていない点の属性情報の残差値を符号化することにより、ビットストリームを得るように構成されている。Mは1より大きい正の整数であり、mは0以上の正の整数である。
【0108】
本出願のいくつかの実施形態において、第一処理ユニット601は具体的に、点群を1つ又は複数のLOD層に分割するように構成されている。各LOD層は1つ又は複数の点を含む。
【0109】
なお、装置実施形態は方法実施形態に対応することが可能であり、類似の説明については、方法実施形態を参照することができる。重複を避けるため、ここではその説明を省略する。具体的に、復号器500は、本出願の実施形態における方法300を実行する主体に対応してもよい。また、復号器500における各ユニットはそれぞれ、方法300における各プロセスを実現するために用いられる。同様に、符号器600は、本出願の実施形態における方法400を実行する主体に対応してもよい。また、符号器600における各ユニットはそれぞれ、方法400における各プロセスを実現するために用いられる。簡潔のため、ここでの説明を省略する。
【0110】
さらに、本出願の実施形態に係る符号器又は復号器における各ユニットは、それぞれもしくは全部で1つもしくはいくつかの他のユニットに統合されてもよく、又は、そのうちのある(いくつかの)ユニットはさらに機能上でより小さい複数のユニットに分割されてもよい。それによって、本出願の実施形態の技術的効果の実現に影響を与えずに同様の操作が実現されることができる。換言すれば、上記ユニットは、ロジック機能に基づいて分割される。実際の応用では、1つのユニットの機能は、複数のユニットによって実現されることができ、又は、複数のユニットの機能は、1つのユニットによって実現されることができる。もちろん、本出願の他の実施形態において、当該符号器又は復号器は、他のユニットを含んでもよく、実際の応用では、これらの機能は、他のユニットが協働することにより実現されてもよく、また複数のユニットが協働することにより実現されてもよい。
【0111】
本出願の他の実施形態によれば、例えば、中央処理装置(central processing unit、CPU)、ランダムアクセスメモリ(random access memory、RAM)、読み取り専用メモリ(read only memory、ROM)などの処理素子及び記憶素子を備えた汎用コンピュータの汎用コンピューター機器で、対応する方法に係る各ステップを実行可能なコンピュータプログラム(プログラムコードを含む)を実行することにより、本出願の実施形態に係る符号器又は復号器を構築し、本出願の実施形態に係る符号化方法又は復号化方法を実現する。コンピュータプログラムは、例えばコンピュータ可読記憶媒体に記録され、コンピュータ可読記憶媒体を介して、処理能力を有する任意の電子機器に装着され、その中で動作することにより、本出願の実施形態における対応の方法を実現することができる。換言すれば、上記に係るユニットは、ハードウェア形態によって実現されてもよく、ソフトウェア形態の命令によって実現されてもよく、ハードウェアとソフトウェアモジュールの組み合わせによって実現されてもよい。具体的に、本出願の実施形態における方法実施形態の各ステップは、プロセッサにおけるハードウェアの集積論理回路(integrated logic circuit)又はソフトウェア形態の命令によって完成されることができる。本出願の実施形態に開示された方法のステップは、直接にハードウェア復号化プロセッサによって実行且つ完成されることができ、又は復号化プロセッサにおけるハードウェアとソフトウェアモジュールの組み合わせによって実行且つ完成されることができる。選択的に、ソフトウェアは、ランダムアクセスメモリ、フラッシュメモリ、読み取り専用メモリ、プログラム可能な読み取り専用メモリ、電気的に消去可能なプログラム可能なメモリ、レジスタなど本技術分野におけるマチュアな記憶媒体に位置することができる。記憶媒体はメモリに位置する。プロセッサは、メモリにおける情報を読み取り、プロセッサのハードウェアとともに上記方法実施形態のステップを完成する。
【0112】
図10は、本出願の実施形態に係る電子機器700を示すブロック図である。
【0113】
図10に示されるように、当該電子機器700は、プロセッサ710と、コンピュータ可読記憶媒体720とを少なくとも含む。なお、プロセッサ710及びコンピュータ可読記憶媒体720は、バス又はその他の方式で接続されてもよい。コンピュータ可読記憶媒体720は、コンピュータ命令を含むコンピュータプログラム721を記憶するために用いられる。プロセッサ710は、コンピュータ可読記憶媒体720に記憶されたコンピュータ命令を実行するために用いられる。プロセッサ710は、電子機器700の計算コア及び制御コアであり、1つ又は複数のコンピュータ命令を実現することに適しており、具体的に、1つ又は複数のコンピュータ命令をロードして実行することにより、対応する方法のプロセス又は対応する機能を実現することに適している。
【0114】
例示として、プロセッサ710は、CPUと呼ばれることもできる。プロセッサ710は、汎用プロセッサ、デジタル信号プロセッサ(digital signal processor、DSP)、特定用途向け集積回路(application specific integrated circuit、ASIC)、フィールドプログラム可能なゲートアレイ(field programmable gate array、FPGA)又は他のプログラム可能なロジックデバイス、ディスクリートゲート又はトランジスタロジックデバイス、ディスクリートハードウェアコンポーネントなどを含むことができるが、それらに限定されない。
【0115】
例示として、コンピュータ可読記憶媒体720は、高速RAMメモリであってもよく、不揮発性メモリー(non-volatile memory)、例えば、少なくとも1つの磁気ディスク記憶装置であってもよい。選択的に、コンピュータ可読記憶媒体720は、プロセッサ710から離れた少なくとも1つのコンピュータ可読記憶媒体であってもよい。具体的に、コンピュータ可読記憶媒体720は、揮発性メモリ及び/又は不揮発性メモリを含むが、それらに限定されない。不揮発性メモリは、ROM、プログラム可能な読み取り専用メモリ(programmable ROM、PROM)、消去可能なプログラム可能な読み取り専用メモリ(erasable PROM、EPROM)、電気的に消去可能なプログラム可能な読み取り専用メモリ(electrically EPROM、EEPROM)、又はフラッシュメモリ(flash memory)であることができる。揮発性メモリは、外部高速キャッシュとして機能するRAMであることができる。例示的であるが限定的ではない例として、様々なRAMが利用可能であり、例えば、スタティックランダムアクセスメモリ(static RAM、SRAM)、ダイナミックランダムアクセスメモリ(dynamic RAM、DRAM)、同期ダイナミックランダムアクセスメモリ(synchronous DRAM、SDRAM)、ダブルデータレート同期ダイナミックランダムアクセスメモリ(double data rate SDRAM、DDRSDRAM)、強化された同期ダイナミックランダムアクセスメモリ(enhanced SDRAM、ESDRAM)、同期リンクダイナミックランダムアクセスメモリ(synch-link DRAM、SLDRAM)、ダイレクトランバスランダムアクセスメモリ(dierct rambus RAM、DRRAM)が挙げられる。
【0116】
1つの実施形態において、当該電子機器700は、
図3に示される復号化フレーム200、又は
図8に示される復号器600であってもよい。当該コンピュータ可読記憶媒体720には、第一コンピュータ命令が記憶されている。プロセッサ710は、コンピュータ可読記憶媒体720に記憶されている第一コンピュータ命令をロードして実行することにより、
図4に示される方法実施形態における対応のステップを実現する。具体的に、コンピュータ可読記憶媒体720における第一コンピュータ命令が、プロセッサ710によってロードされ且つ実行されて、対応のステップを実行する。重複を避けるため、ここでは説明を省略する。
【0117】
1つの実施形態において、当該電子機器700は、
図1に示される符号化フレーム100、又は
図9に示される符号器600であってもよい。当該コンピュータ可読記憶媒体720には、第二コンピュータ命令が記憶されている。プロセッサ710は、コンピュータ可読記憶媒体720に記憶されている第二コンピュータ命令をロードして実行することにより、
図7に示される方法実施形態における対応のステップを実現する。具体的に、コンピュータ可読記憶媒体720における第二コンピュータ命令が、プロセッサ710によってロードされ且つ実行されて、対応のステップを実行する。重複を避けるため、ここでは説明を省略する。
【0118】
本出願の別の様態によれば、本出願の実施形態において、コンピュータ可読記憶媒体(Memory)が提供される。コンピュータ可読記憶媒体は、電子機器700における記憶デバイスであり、プログラム及びデータを記憶するために用いられる。例えば、コンピュータ可読記憶媒体は、コンピュータ可読記憶媒体720であってもよい。ここのコンピュータ可読記憶媒体720は、電子機器700における内蔵記憶媒体を含んでもよく、もちろん、電子機器700によってサポートされる拡張記憶媒体(extended storage medium)を含んでもよい。コンピュータ可読記憶媒体は、電子機器700のオペレーティングシステムが記憶された記憶空間を提供する。さらに、当該記憶空間には、プロセッサ710によってロードされ且つ実行されることに適した1つ又は複数のコンピュータ命令が記憶されており、これらのコンピュータ命令は、1つ又は複数のコンピュータプログラム721(プログラムコードを含む)であってもよい。
【0119】
本出願の別の様態によれば、コンピュータプログラム製品又はコンピュータプログラムが提供される。当該コンピュータプログラム製品又はコンピュータプログラムはコンピュータ命令を含み、当該コンピュータ命令は、コンピュータ可読記憶媒体に記憶されており、例えば、当該コンピュータ命令は、コンピュータープログラム721であってもよい。この場合、電子機器700はコンピューターであることができ、プロセッサ710は、コンピュータ可読記憶媒体720から当該コンピューター命令を読み取り、プロセッサ710は、当該コンピューター命令を実行することにより、当該コンピューターに上記各種の選択可能な方式に係る符号化方法又は復号化方法を実行させる。
【0120】
換言すれば、ソフトウェアによって実現される場合、上記実施形態の全部又は一部は、コンピュータプログラム製品の形式で実現されることができる。当該コンピュータプログラム製品は、一つ又は複数のコンピュータ命令を含む。コンピュータプログラム命令がコンピュータでロードされ且つ実行されるとき、本出願の実施形態のプロセス又は本出願の実施形態の機能の全部又は一部を実行する。当該コンピュータは、汎用コンピュータ、専用コンピュータ、コンピュータネットワーク又は他のプログラム可能な装置であることができる。当該コンピュータ命令は、コンピュータ可読記憶媒体に記憶され、又は一つのコンピュータ可読記憶媒体から別のコンピュータ可読記憶媒体に伝送されることができる。例えば、当該コンピュータ命令は、一つのウェブサイト、コンピュータ、サーバ又はデータセンターから有線(例えば、同軸ケーブル、光ファイバー、デジタル加入者線(digital subscriber line、DSL)など)又は無線(例えば、赤外線、無線、マイクロ波など)で別のウェブサイト、コンピュータ、サーバ又はデータセンターに伝送されることができる。
【0121】
本明細書に開示された実施形態に記載される各例示的なユニット及びプロセスと結びつけて、本出願が電子ハードウェア、又はコンピュータソフトウェアと電子ハードウェアとの組み合わせにより実現され得ることは、当業者が意識することができる。これらの機能が、ハードウェアにより実行されるかソフトウェアにより実行されるかについては、技術的解決策の特定の応用場合や設計の制限条件などによって決められる。当業者は、特定応用ごとに異なる方法を使用して記載される機能を実現できるが、これらの実現は、本出願の範囲を超えると見なされるべきではない。
【0122】
最後に、上記内容は、ただ本出願の具体的な実施形態であり、本出願の保護範囲はそれに限定されないということが説明される必要がある。当業者が本出願に開示された技術範囲内で容易に想到し得る変更又は置換は全て本出願の保護範囲内に含まれるべきである。従って、本出願の保護範囲は特許請求の保護範囲に準じるべきである。
【手続補正書】
【提出日】2023-11-24
【手続補正1】
【補正対象書類名】明細書
【補正対象項目名】0010
【補正方法】変更
【補正の内容】
【0010】
別の態様において、本出願の実施形態では、電子機器が提供される。当該電子機器は、プロセッサ及びコンピュータ可読記憶媒体を含む。プロセッサは、コンピュータ命令を実行することに適している。コンピュータ可読記憶媒体にコンピュータ命令が記憶されており、コンピュータ命令がプロセッサによってロードされて、上記点群復号化方法又は点群符号化方法を実行することに適している。
【手続補正2】
【補正対象書類名】明細書
【補正対象項目名】0011
【補正方法】変更
【補正の内容】
【0011】
別の態様において、本出願の実施形態では、コンピュータ可読記憶媒体が提供される。当該コンピュータ可読記憶媒体にコンピュータ命令が記憶されており、当該コンピュータ命令がコンピュータ装置のプロセッサによって読み取られ且つ実行される場合、コンピュータ装置に上記点群復号化方法又は点群符号化方法を実行させる。
【手続補正3】
【補正対象書類名】明細書
【補正対象項目名】0040
【補正方法】変更
【補正の内容】
【0040】
なお、圧縮解除は圧縮の逆過程であり、同様に、復号化フレームワーク200における各ユニットの機能については、符号化フレームワーク100における対応のユニットの機能を参照することができる。例えば、復号化フレームワーク200において、点群における点と点の間のユークリッド距離に応じて点群を複数のLODに分割し、次に、LODにおける点の属性情報を順次復号化することができる。例えば、ゼロランレングス符号化技術におけるゼロの数(zero_cnt)を計算し、ゼロの数に基づいて残差値を復号化し、次に、復号化フレームワーク200において、全ての点が復号化されるまで、復号化された残差値に基づいて逆量子化を行い、逆量子化後の残差値と、現在点の予測値とを加算することにより当該点の再構成値を得ることができる。ゼロランレングス符号化技術に基づいて復号化操作が行われる。まず、ビットストリームにおける1番目のzero_cntのサイズが取得される。zero_cntが0より大きい場合、この点の属性情報の残差値が0であることが示される。zero_cntが0に等しい場合、この点の属性情報の残差値が0ではないことが示される。残差値が0である場合、第一解析関数を利用して残差値を解析し、残差値が0ではない場合、第二解析関数を利用して残差値を解析する。現在点はLODにおける後続点の最近の近傍点とされ、現在点の再構成値を利用して後続点の属性情報が予測される。また、逆変換及び逆量子化(スケーリングとも呼ばれる)については、直交変換では、一方の行列が変換に用いられる場合、他方の行列が逆変換に用いられる。復号化方法では、復号器に使用される行列は、「変換」(transform)行列と呼ばれることができる。
【手続補正4】
【補正対象書類名】明細書
【補正対象項目名】0068
【補正方法】変更
【補正の内容】
【0068】
本出願のいくつかの実施形態において、上記S301は、以下の内容を含むことができる。点群における1つのLOD層における点の数が閾値Mより小さい場合、LOD層における各点に対して、可逆符号化された点の属性情報の残差値及び点の属性情報の予測値に基づいて、点の属性情報の初期再構成値を得る。点群における1つのLOD層における点の数が閾値M以上である場合、LOD層における(m*M)番目の点に対して、可逆符号化された点の属性情報の残差値及び点の属性情報の予測値に基づいて、点の属性情報の初期再構成値を得る。Mは1より大きい正の整数であり、mは0より大きい正の整数である。
【手続補正5】
【補正対象書類名】明細書
【補正対象項目名】0071
【補正方法】変更
【補正の内容】
【0071】
本出願のいくつかの実施形態において、上記S301は以下の内容を含むことができる。点群における1つのLOD層における点の数が閾値Tより小さい場合、LOD層における各点に対して、点の属性情報の最終再構成値を当該点の属性情報の真値に置き換える。点群における1つのLOD層における点の数が閾値T以上である場合、LOD層における(t*T)番目の点の属性情報の最終再構成値を当該点の属性情報の真値に置き換える。Tは1より大きい正の整数であり、tは0より大きい正の整数である。
【手続補正6】
【補正対象書類名】明細書
【補正対象項目名】0078
【補正方法】変更
【補正の内容】
【0078】
具体的に、復号器は、点群をトラバースすることで、点群における現在点の属性情報の初期再構成値(RGB値)を取得し、復号器は、現在点の前の3つの点の属性情報の再構成値の平均再構成値を計算する。そして、復号器は、関数transformGbrToYCbCrBt709を利用して、現在点の初期再構成値と前の3つの点の再構成値の平均再構成値とをRGBドメインからYUVドメインに変換することができ、即ち、復号器は、平均再構成値の平均彩度値と平均輝度値、及び現在点の初期彩度値と初期輝度値を得る。次に、復号器は、得られた平均彩度値を測定値とし、初期彩度値を予測値としてカルマンフィルタリングを行い、現在点の最終彩度値を得て、さらに現在点の最終彩度値と初期輝度値とに基づいて最終再構成値を得る。換言すれば、YUVコンポーネントのUVコンポーネントがカルマンフィルタリングに必要な入力パラメータとされ、即ち測定値とされ、現在点のYUVコンポーネントのUVコンポーネントがカルマンフィルタリングの別の入力パラメータとされ、即ち予測値とされる。カルマンフィルタリングが終了した後、フィルタリング後の最終再構成値は現在点の初期再構成値をカバーする。
【手続補正7】
【補正対象書類名】明細書
【補正対象項目名】0080
【補正方法】変更
【補正の内容】
【0080】
図7は、本出願の実施形態に係る点群符号化方法400を示すフローチャートである。当該方法400は、符号化側によって実行されることができ、例えば、図
1に示された符号化フレームワーク100又は符号器によって実行され得る。
【手続補正8】
【補正対象書類名】明細書
【補正対象項目名】0087
【補正方法】変更
【補正の内容】
【0087】
本出願のいくつかの実施形態において、上記S405は、以下の内容を含むことができる。点群における1つのLOD層における点の数が閾値Mより小さい場合、LOD層における各点に対して、逆量子化されていない点の属性情報の残差値を符号化することにより、ビットストリームを得る。点群における1つのLOD層における点の数が閾値M以上である場合、LOD層における(m*M)番目の点に対して、逆量子化されていない点の属性情報の残差値を符号化することにより、ビットストリームを得る。Mは1より大きい正の整数であり、mは0より大きい正の整数である。
【手続補正9】
【補正対象書類名】明細書
【補正対象項目名】0088
【補正方法】変更
【補正の内容】
【0088】
具体的に、符号器は、点群における1つの目標点の位置情報を処理することにより、目標点の位置情報の再構成情報を得る。符号器は、目標点の位置情報の再構成情報に基づいて、目標点の属性情報の予測値を得る。符号器は、点群における目標点の属性情報を処理することにより、目標点の属性情報の真値を得る。符号器は、目標点の属性情報の予測値及び目標点の属性情報の真値に基づいて、目標点の属性情報の残差値を得る。符号器は、目標点の属性情報の残差値を符号化することにより、ビットストリームを得る。選択的に、さらに、符号器は、属性情報の残差値を量子化することを必要としない点の数を符号化することができる。例えば、点群における1つのLOD層における点の数が閾値Mより小さい場合、LOD層における各点に対して、符号器は、逆量子化されていない点の属性情報の残差値を符号化することにより、ビットストリームを得る。点群における1つのLOD層における点の数が閾値M以上である場合、LOD層における(m*M)番目の点に対して、逆量子化されていない点の属性情報の残差値を符号化することにより、ビットストリームを得る。Mは1より大きい正の整数であり、mは0より大きい正の整数である。
【手続補正10】
【補正対象書類名】明細書
【補正対象項目名】0099
【補正方法】変更
【補正の内容】
【0099】
本出願のいくつかの実施形態において、解析ユニット501は具体的に、点群における1つのLOD層における点の数が閾値Mより小さい場合、LOD層における各点に対して、可逆符号化された点の属性情報の残差値及び点の属性情報の予測値に基づいて、点の属性情報の初期再構成値を得、又は、点群における1つのLOD層における点の数が閾値M以上である場合、LOD層における(m*M)番目の点に対して、可逆符号化された点の属性情報の残差値及び点の属性情報の予測値に基づいて、点の属性情報の初期再構成値を得るように構成されている。Mは1より大きい正の整数であり、mは0より大きい正の整数である。
【手続補正11】
【補正対象書類名】明細書
【補正対象項目名】0101
【補正方法】変更
【補正の内容】
【0101】
本出願のいくつかの実施形態において、解析ユニット501は具体的に、点群における1つのLOD層における点の数が閾値Tより小さい場合、LOD層における各点に対して、点の属性情報の最終再構成値を当該点の属性情報の真値に置き換え、又は、点群における1つのLOD層における点の数が閾値T以上である場合、LOD層における(t*T)番目の点の属性情報の最終再構成値を当該点の属性情報の真値に置き換えるように構成されている。Tは1より大きい正の整数であり、tは0より大きい正の整数である、
【手続補正12】
【補正対象書類名】明細書
【補正対象項目名】0107
【補正方法】変更
【補正の内容】
【0107】
本出願のいくつかの実施形態において、符号化ユニット605は具体的に、点群における1つのLOD層における点の数が閾値Mより小さい場合、LOD層における各点に対して、逆量子化されていない点の属性情報の残差値を符号化することにより、ビットストリームを得、又は、点群における1つのLOD層における点の数が閾値M以上である場合、LOD層における(m*M)番目の点に対して、逆量子化されていない点の属性情報の残差値を符号化することにより、ビットストリームを得るように構成されている。Mは1より大きい正の整数であり、mは0より大きい正の整数である。
【手続補正13】
【補正対象書類名】明細書
【補正対象項目名】0113
【補正方法】変更
【補正の内容】
【0113】
図10に示されるように、当該電子機器700は、プロセッサ710と、コンピュータ可読記憶媒体720とを少なくとも含む。なお、プロセッサ710及びコンピュータ可読記憶媒体720は、バス又はその他の方式で接続されてもよい。コンピュータ可読記憶媒体720は、コンピュータ命令を含むコンピュータプログラム721を記憶するために用いられる。プロセッサ710は、コンピュータ可読記憶媒体720に記憶されたコンピュータ命令を実行するために用いられる。プロセッサ710は、電子機器700の計算コア及び制御コアであり、1つ又は複数のコンピュータ命令を実現することに適しており、具体的に、1つ又は複数のコンピュータ命令をロードして実行することにより、対応する方法のプロセス又は対応する機能を実現することに適している。
電子機器700は、トランシーバー730をさらに備える。
【手続補正14】
【補正対象書類名】明細書
【補正対象項目名】0116
【補正方法】変更
【補正の内容】
【0116】
1つの実施形態において、当該電子機器700は、
図3に示される復号化フレーム200、又は
図8に示される復号器
500であってもよい。当該コンピュータ可読記憶媒体720には、第一コンピュータ命令が記憶されている。プロセッサ710は、コンピュータ可読記憶媒体720に記憶されている第一コンピュータ命令をロードして実行することにより、
図4に示される方法実施形態における対応のステップを実現する。具体的に、コンピュータ可読記憶媒体720における第一コンピュータ命令が、プロセッサ710によってロードされ且つ実行されて、対応のステップを実行する。重複を避けるため、ここでは説明を省略する。
【手続補正15】
【補正対象書類名】特許請求の範囲
【補正対象項目名】全文
【補正方法】変更
【補正の内容】
【特許請求の範囲】
【請求項1】
点群復号化方法であって、
点群のビットストリームを解析することにより、前記点群における1つの目標点の属性情報の初期再構成値を得ることと、
前記初期再構成値を初期輝度値及び初期彩度値に変換することと、
カルマンフィルタリングアルゴリズムを利用して前記初期彩度値をフィルタリングすることにより、最終彩度値を得ることと、
前記最終彩度値及び前記初期輝度値に基づいて、前記目標点の属性情報の最終再構成値を得ることと、
前記目標点の属性情報の最終再構成値に基づいて、復号化された点群を得ることとを含む、
ことを特徴とする点群復号化方法。
【請求項2】
前記カルマンフィルタリングアルゴリズムを利用して前記初期彩度値をフィルタリングすることにより、最終彩度値を得ることは、
前記目標点の前の1つ又は複数の点の属性情報の再構成値の彩度値を測定値とし、前記カルマンフィルタリングアルゴリズムを利用して前記初期彩度値をフィルタリングすることにより、最終彩度値を得ることを含む、
ことを特徴とする請求項1に記載の
点群復号化方法。
【請求項3】
前記目標点の前の1つ又は複数の点の属性情報の再構成値の彩度値を測定値とし、前記カルマンフィルタリングアルゴリズムを利用して前記初期彩度値をフィルタリングすることにより最終彩度値を得ることは、
前記目標点の前の1つ又は複数の点の属性情報の再構成値の平均再構成値を計算することと、
前記平均再構成値を平均輝度値及び平均彩度値に変換することと、
前記平均彩度値を測定値とし、前記カルマンフィルタリングアルゴリズムを利用して前記初期彩度値をフィルタリングすることにより、前記最終彩度値を得ることを含む、
ことを特徴とする請求項2に記載の
点群復号化方法。
【請求項4】
前記目標点の前の1つ又は複数の点は、復号化順に基づいて前記目標点の前に位置する1つ又は複数の点である、
ことを特徴とする請求項2に記載の
点群復号化方法。
【請求項5】
前記目標点の属性情報の残差値は、複数の量子化ステップサイズのうちの目標量子化ステップサイズに基づいて逆量子化を行うことにより得られ、前記初期再構成値を初期輝度値及び初期彩度値に変換することは、
前記目標量子化ステップサイズが閾値N以上である場合、前記初期再構成値を前記初期輝度値及び前記初期彩度値に変換することを含み、
Nは非負整数である、
ことを特徴とする請求項1に記載の
点群復号化方法。
【請求項6】
前記複数の量子化ステップサイズは昇順にソートされ、Nは前記複数の量子化ステップサイズのうちのn番目の量子化ステップサイズの値であり、nは正の整数である、
ことを特徴とする請求項5に記載の
点群復号化方法。
【請求項7】
前記初期再構成値を初期輝度値及び初期彩度値に変換することは、
色空間変換関数を利用して前記初期再構成値を前記初期輝度値及び前記初期彩度値に変換することを含み、
前記初期輝度値及び前記初期彩度値は、ディスプレイスクリーンによってサポートされる色空間内に位置する、
ことを特徴とする請求項1に記載の
点群復号化方法。
【請求項8】
前記点群のビットストリームを解析することにより、前記点群における1つの目標点の属性情報の初期再構成値を得ることは、
前記点群における1つの詳細レベル(LOD)層における点の数が閾値Mより小さい場合、前記LOD層における各点に対して、可逆符号化された点の属性情報の残差値及び点の属性情報の予測値に基づいて、点の属性情報の初期再構成値を得ること、又は、
前記点群における1つのLOD層における点の数が前記閾値M以上である場合、前記LOD層における(m*M)番目の点に対して、可逆符号化された点の属性情報の残差値及び点の属性情報の予測値に基づいて、点の属性情報の初期再構成値を得ることを含み、
Mは1より大きい正の整数であり、mは0
より大きい正の整数である、
ことを特徴とする請求項1に記載の
点群復号化方法。
【請求項9】
前記
点群復号化方法は、
前記ビットストリームを解析することにより、前記ビットストリームにおける、属性情報の残差値が逆量子化を必要としない点の数を得ることをさらに含む、
ことを特徴とする請求項8に記載の
点群復号化方法。
【請求項10】
前記点群のビットストリームを解析することにより、前記点群における1つの目標点の属性情報の初期再構成値を得ることは、
前記点群における1つのLOD層における点の数が閾値Tより小さい場合、前記LOD層における各点に対して、点の属性情報の最終再構成値を当該点の属性情報の真値に置き換えること、又は、
前記点群における1つのLOD層における点の数が前記閾値T以上である場合、前記LOD層における(t*T)番目の点の属性情報の最終再構成値を当該点の属性情報の真値に置き換えることを含み、
Tは1より大きい正の整数であり、tは0
より大きい正の整数である、
ことを特徴とする請求項1に記載の
点群復号化方法。
【請求項11】
前記
点群復号化方法は、
前記ビットストリームを解析することにより、前記ビットストリームにおける、属性情報の最終再構成値が真値である点の数と、点の属性情報の真値とを得ることをさらに含む、
ことを特徴とする請求項10に記載の
点群復号化方法。
【請求項12】
前記点群のビットストリームを解析することにより、前記点群における1つの目標点の属性情報の初期再構成値を得ることは、
前記ビットストリームを解析することにより、前記目標点の位置情報の再構成情報を得ることと、
前記目標点の位置情報の再構成情報に基づいて、前記目標点の属性情報の予測値を得ることと、
前記ビットストリームを解析することにより、前記目標点の属性情報の残差値を得ることと、
前記目標点の属性情報の予測値及び前記目標点の属性情報の残差値に基づいて、前記目標点の属性情報の初期再構成値を得ることとを含む、
ことを特徴とする請求項1に記載の
点群復号化方法。
【請求項13】
点群符号化方法であって、
点群における1つの目標点の位置情報を処理することにより、前記目標点の位置情報の再構成情報を得ることと、
前記目標点の位置情報の再構成情報に基づいて、前記目標点の属性情報の予測値を得ることと、
前記点群における前記目標点の属性情報を処理することにより、前記目標点の属性情報の真値を得ることと、
前記目標点の属性情報の予測値及び前記目標点の属性情報の真値に基づいて、前記目標点の属性情報の残差値を得ることと、
ビットストリームに書き込まれる必要がある、可逆符号化された点の属性情報の残差値の数と前記目標点の属性情報の残差値とを符号化することにより、前記ビットストリームを得ることとを含む、
ことを特徴とする点群符号化方法。
【請求項14】
復号器であって、解析ユニット、変換ユニット、フィルタリングユニット、第一処理ユニット、及び第二処理ユニットを含み、
前記解析ユニットは、点群のビットストリームを解析することにより、前記点群における1つの目標点の属性情報の初期再構成値を得るように構成されており、
前記変換ユニットは、前記初期再構成値を初期輝度値及び初期彩度値に変換するように構成されており、
前記フィルタリングユニットは、カルマンフィルタリングアルゴリズムを利用して前記初期彩度値をフィルタリングすることにより、最終彩度値を得るように構成されており、
前記第一処理ユニットは、前記最終彩度値及び前記初期輝度値に基づいて、前記目標点の属性情報の最終再構成値を得るように構成されており、
前記第二処理ユニットは、前記目標点の属性情報の最終再構成値に基づいて、復号化された点群を得るように構成されている、
ことを特徴とする復号器。
【請求項15】
符号器あって、第一処理ユニット、第二処理ユニット、第三処理ユニット、第四処理ユニット、及び符号化ユニットを含み、
前記第一処理ユニットは、点群における1つの目標点の位置情報を処理することにより、前記目標点の位置情報の再構成情報を得るように構成されており、
前記第二処理ユニットは、前記目標点の位置情報の再構成情報に基づいて、前記目標点の属性情報の予測値を得るように構成されており、
前記第三処理ユニットは、前記点群における前記目標点の属性情報を処理することにより、前記目標点の属性情報の真値を得るように構成されており、
前記第四処理ユニットは、前記目標点の属性情報の予測値及び前記目標点の属性情報の真値に基づいて、前記目標点の属性情報の残差値を得るように構成されており、
前記符号化ユニットは、ビットストリームに書き込まれる必要がある、可逆符号化された点の属性情報の残差値の数と前記目標点の属性情報の残差値とを符号化することにより、前記ビットストリームを得るように構成されている、
ことを特徴とする符号器。
【国際調査報告】