(81)【指定国】
AP(BW,GH,GM,KE,LR,LS,MW,MZ,NA,RW,SD,SL,ST,SZ,TZ,UG,ZM,ZW),EA(AM,AZ,BY,KG,KZ,RU,TJ,TM),EP(AL,AT,BE,BG,CH,CY,CZ,DE,DK,EE,ES,FI,FR,GB,GR,HR,HU,IE,IS,IT,LT,LU,LV,MC,MK,MT,NL,NO,PL,PT,RO,RS,SE,SI,SK,SM,TR),OA(BF,BJ,CF,CG,CI,CM,GA,GN,GQ,GW,KM,ML,MR,NE,SN,TD,TG),AE,AG,AL,AM,AO,AT,AU,AZ,BA,BB,BG,BH,BN,BR,BW,BY,BZ,CA,CH,CL,CN,CO,CR,CU,CZ,DE,DJ,DK,DM,DO,DZ,EC,EE,EG,ES,FI,GB,GD,GE,GH,GM,GT,HN,HR,HU,ID,IL,IN,IR,IS,JO,JP,KE,KG,KH,KN,KP,KR,KW,KZ,LA,LC,LK,LR,LS,LU,LY,MA,MD,ME,MG,MK,MN,MW,MX,MY,MZ,NA,NG,NI,NO,NZ,OM,PA,PE,PG,PH,PL,PT,QA,RO,RS,RU,RW,SA,SC,SD,SE,SG,SK,SL,SM,ST,SV,SY,TH,TJ,TM,TN,TR,TT
少なくとも1つの実施形態は、少なくとも1つの3Dサンプルを点群フレームに追加し、色分けモードを当該少なくとも1つの3Dサンプルに割り当てるための方法に関し、当該色分けモードは、当該少なくとも1つの3Dサンプルに関連付けられた色情報が、ビットストリームで明示的に符号化されているかどうか、または当該色情報が暗黙的であるかどうかを示す。
少なくとも1つの3Dサンプルが、現在の3Dサンプルの隣接する3Dサンプルの深度値と、前記現在の3Dサンプルの深度値との間の差に従って、前記点群フレームの前記現在の3Dサンプルから追加される、請求項1または2に記載の方法。
少なくとも1つの3Dサンプルが、前記点群フレームの現在の3Dサンプルの深度値から、前記現在の3Dサンプルの前記深度値と最大深度差との合計−1に等しい深度値の範囲にわたる深度値を使って追加され、前記最大深度差が、前記現在の3Dサンプルの深度と、前記現在の3Dサンプルの隣接する3Dサンプルの深度との間の差に等しい、請求項1〜3のうちの一項に記載の方法。
少なくとも1つの3Dサンプルが、前記点群フレームの現在の3Dサンプルの、画像面上への投影を表す2Dサンプルと同じ2D位置において、前記最大深度差0まで追加される、請求項4に記載の方法。
少なくとも1つの3Dサンプルが、前記点群フレームの現在の3Dサンプルの、前記画像面上への投影を表す2Dサンプルと同じ2D位置において、前記最大深度差−1まで追加され、別の3Dサンプルは、前記隣接する3Dサンプルの投影を表す2Dサンプルとして、前記最大深度差−1に等しい深度値を使って、前記2D位置において追加される、請求項3に記載の方法。
前記最大深度差が計算されるとき、前記点群フレームの現在の3Dサンプルの深度値と、隣接する3Dサンプルの深度値との差は、前記差が値の所与の範囲に属さない場合は、無視される、請求項3に記載の方法。
明示的な色分けモードが3Dサンプルに関連付けられている場合、前記3Dサンプルに関連付けられた前記色情報が、画像データとして符号化され、暗黙的な色分けモードが3Dサンプルに関連付けられている場合、前記3Dサンプルに関連付けられた前記色情報が、他の3Dサンプルに関連付けられた色情報を補間することによって取得される、請求項1に記載の方法。
少なくとも1つの3Dサンプルが、現在の3Dサンプルの隣接する3Dサンプルの深度値と、前記現在の3Dサンプルの深度値との差に従って、前記点群フレームの前記現在の3Dサンプルから追加される、請求項14または15に記載の方法。
少なくとも1つの3Dサンプルが、前記点群フレームの現在の3Dサンプルの深度値から、前記現在の3Dサンプルの前記深度値と最大深度差との合計−1に等しい深度値の範囲にわたる深度値を使って追加され、前記最大深度差が、前記現在の3Dサンプルの深度と、前記現在の3Dサンプルの隣接する3Dサンプルの深度との間の差に等しい、請求項14または15に記載の方法。
少なくとも1つの3Dサンプルが、前記点群フレームの現在の3Dサンプルの、画像面上への投影を表す2Dサンプルと同じ2D位置において、前記最大深度差まで追加される、請求項17に記載の方法。
少なくとも1つの3Dサンプルが、前記点群フレームの現在の3Dサンプルの、前記画像面上への投影を表す2Dサンプルと同じ2D位置において、前記最大深度差−1まで追加され、別の3Dサンプルは、前記隣接する3Dサンプルの投影を表す2Dサンプルとして、前記最大深度差−1に等しい深度値を使って、前記2D位置において追加される、請求項16に記載の方法。
前記最大深度差が計算されるとき、前記点群フレームの現在の3Dサンプルの深度値と、隣接する3Dサンプルの深度値との差は、前記差が値の所与の範囲に属さない場合は、無視される、請求項17に記載の方法。
明示的な色分けモードが3Dサンプルに関連付けられている場合、前記3Dサンプルに関連付けられた前記色情報が、画像データとして符号化され、暗黙的な色分けモードが3Dサンプルに関連付けられている場合、前記3Dサンプルに関連付けられた前記色情報が、他の3Dサンプルに関連付けられた色情報を補間することによって取得される、請求項14に記載の方法。
少なくとも1つの3Dサンプルのための色分けモードを含む信号であって、前記色分けモードは、前記少なくとも1つの3Dサンプルに関連付けられた色情報が、ビットストリームで明示的に符号化されているかどうか、または前記色情報が暗黙的であるかどうかを示す、信号。
前記信号は、前記少なくとも1つの3Dサンプルに関連付けられた色分けモードが、色情報が明示的であることを示すときに、少なくとも1つの3Dサンプルに関連付けられた前記色情報をさらに含む、請求項26に記載の信号。
前記信号が、点群の現在の3Dサンプルの深度と、前記現在の3Dサンプルの隣接する3Dサンプルの深度との間の差に等しい最大深度差に関連する情報をさらに含む、請求項26または27に記載の信号。
【発明を実施するための形態】
【0015】
本実施形態のうちの少なくとも1つは、添付した図を参照して、これ以降さらに十分に説明され、そこでは、本実施形態のうちの少なくとも1つの例が示される。ただし、一実施形態が、多くの代替形態で具現化され得、本明細書に記述される例に限定されるものと解釈されるべきではない。したがって、実施形態を、開示された特定の形態に限定する意図はないことを理解されたい。逆に、本開示は、本明細書の精神および範囲内に含まれるすべての変更物、等価物、および代替物を網羅することを意図されている。
【0016】
図がフロー図として提示されている場合、その図はまた、対応する装置のブロック図も提供することを理解されたい。同様に、図がブロック図として提示されている場合、その図はまた、対応する方法/プロセスのフロー図も提供することを理解されたい。同様または同一の要素は、同一の参照番号を使って参照される。
【0017】
以下に説明および想定される態様は、多くの異なる形態で実施され得る。以下の
図1〜
図12は、いくつかの実施形態を提供するが、他の実施形態が想定され、
図1〜
図12の考察は、その実施態様の間口を限定するものではない。
【0018】
態様のうちの少なくとも1つは、一般に、点群の符号化および復号化に関するものであり、少なくとも1つの他の態様は、一般に、生成または符号化されるビットストリームを送信することに関する。
【0019】
より正確には、本明細書に記載されている様々な方法および他の態様を使用して、モジュールを修正することができる。それらの修正は、点群の幾何形状を再構築した直後、または幾何形状を再構築して色情報を割り当てた直後に実行することができる。パッチ生成モジュールPGM(
図3のステップ3100)、テクスチャ画像生成器TIG(
図3のステップ3400)、および幾何形状生成モジュールGGM(
図4のステップ4500)は、潜在的な修正モジュールの例である。
【0020】
例えば、パッチ生成モジュールPGM(
図3のステップ3100)は、少なくとも1つのスタッフィング3Dサンプルを追加し、当該少なくとも1つのスタッフィング3Dサンプルに関連付けられた色情報を明示的に符号化する(または符号化されない)。テクスチャ画像生成器TIG(
図3のステップ3400)または幾何形状生成モジュールGGM(
図4のステップ4500)は、補間された色情報、または復号化された色情報をスタッフィング3Dサンプルに割り当てることができる。
【0021】
さらに、本態様は、点群圧縮に関係するMPEG−Iパート5などのMPEG標準規格に限定されず、例えば、既存であるかまたは将来開発されるかにかかわらず、他の標準規格および勧告、ならびに係る任意の標準規格および勧告の拡張(MPEG−Iパート5を含む)に適用され得る。他に特段の指示がない限り、または技術的に除外されない限り、本明細書に記載される態様は、個別に、または組み合わせて使用され得る。
【0022】
以下では、画像データとは、データ、例えば、特定の画像/ビデオ形式における2Dサンプルのうちの1つまたはいくつかの配列を指す。特定の画像/ビデオ形式は、画像(またはビデオ)の画素値に関する情報を指定することができる。特定の画像/ビデオ形式はまた、情報を指定することができ、その情報は、ディスプレイおよび/または任意の他の装置によって使用されて、例えば、画像(またはビデオ)を視覚化および/または復号化することができる。画像は、一般に、2Dサンプルの第1の配列の形で、通常、画像の輝度(またはルーマ)を表す第1の成分を含む。画像はまた、2Dサンプルの他の配列の形で、通常、画像の色度(またはクロマ)を表す第2の成分および第3の成分も含むことができる。いくつかの実施形態は、従来の3色RGB表現などの、色サンプルの一組の2D配列を使用して同じ情報を表す。
【0023】
画素値は、C値のベクトルによって1つ以上の実施形態で表され、ここで、Cは、成分の数である。ベクトルの各値は、一般に、画素値のダイナミックレンジを規定することができるビット数を使用して表される。
【0024】
画像ブロックとは、画像に属する一組の画素を意味する。画像ブロック(または画像ブロックデータ)の画素値とは、この画像ブロックに属する画素の値を指す。画像ブロックは、任意の形状を有してもよいが、長方形が一般的である。
【0025】
点群は、3D容積空間内の3Dサンプルのデータセットによって表され得、その3Dサンプルのデータセットは、固有の座標を有し、1つ以上の属性も有し得る。
【0026】
このデータセットの3Dサンプルは、その空間位置(3D空間内のX、Y、およびZ座標)によって定義されてもよく、場合によっては、例えば、RGBまたはYUV色空間で表される色、透明度、反射率、2つの成分法線ベクトル、またはこのサンプルの特徴を表す任意の特徴、などの1つ以上の関連付けられた属性によって定義されてもよい。例えば、3Dサンプルは、6成分(X,Y,Z,R,G,B)または言い換えると(X,Y,Z,y,U,V)によって定義され得、ここで、(X,Y,Z)は、3D空間内の点の座標を定義し、(R,G,B)または(y,U,V)は、この3Dサンプルの色を定義する。同じ種類の属性が、複数回存在してもよい。例えば、複数の色属性は、異なる視点から色情報を提供することができる。
【0027】
点群は、群が時間に対して変化するか否かに応じて、静的または動的であり得る。静的点群、または動的点群のインスタンスは、普通、点群フレームとして示される。動的点群の場合、3Dサンプルの数は、一般に一定ではないが、対照的に、一般に時間と共に変化することに留意されたい。より一般的には、点群は、例えば、点の数、1つ以上の点の位置、または任意の点の任意の属性などの何かが時間と共に変化する場合、動的なものと見なすことができる。
【0028】
例として、2Dサンプルは、6成分(u,v,Z,R,G,B)、または同等に(u,v,Z,y,U,V)によって定義され得る。(u,v)は、投影面の2D空間内の2Dサンプルの座標を定義する。Zは、この投影面上に投影された3Dサンプルの深度値である。(R,G,B)または(y,U,V)は、この3Dサンプルの色を定義する。
【0029】
図1は、本実施形態のうちの少なくとも1つに従う、2層ベースの点群符号化構造1000の例の概略ブロック図を示す。
【0030】
2層ベースの点群符号化構造1000は、入力点群フレームIPCFを表すビットストリームBを提供することができる。場合によっては、当該入力点群フレームIPCFは、動的点群のフレームを表す。次いで、当該動的点群のフレームは、別のフレームとは独立して、2層ベースの点群符号化構造1000によって符号化され得る。
【0031】
基本的に、2層ベースの点群符号化構造1000は、ベース層BLおよびエンハンスメント層ELとしてビットストリームBを構造化する能力を提供することができる。ベース層BLは、入力点群フレームIPCFの不可逆表現を提供することができ、エンハンスメント層ELは、ベース層BLによって表されない孤立した点を符号化することによって、可逆表現を提供することができる。可能な選択肢として、エンハンスメント層ELは、ベース層BLによっては表されない追加の点を符号化することによって、入力点群フレームIPCFのより高品質(ただし、不可逆)の表現を提供することができる。
【0032】
ベース層BLは、
図3に示すように、画像ベースエンコーダ3000によって提供され得、その画像ベースエンコーダは、入力点群フレームIPCFの3Dサンプルの幾何形状/属性を表す幾何形状/テクスチャ画像を提供することができ、孤立した3Dサンプルを廃棄するのを可能にすることができる。ベース層BLは、
図4に示すように、画像ベースデコーダ4000によって復号化され得、その画像ベースデコーダは、中間の再構築された点群フレームIRPCFを提供することができる。
【0033】
次いで、
図1の2層ベースの点群符号化1000に戻ると、コンパレータCOMPが、入力点群フレームIPCFの3Dサンプルを中間の再構築された点群フレームIRPCFと比較して、見逃した/孤立した3Dサンプルを検出/配置することができる。次に、エンコーダENCが、見逃した3Dサンプルを符号化し得、エンハンスメント層ELを提供することができる。最後に、ベース層BLおよびエンハンスメント層ELは、多重化デバイスMUXによって共に多重化されてビットストリームBを生成することができる。
【0034】
実施形態によれば、エンコーダENCは、中間の再構築された点群フレームIRPCFの3D基準サンプルを検出し、見逃した3DサンプルMに関連付け得る検出器を含み得る。エンコーダENCはまた、画像ベースエンコーダとすることもできる。
【0035】
例えば、見逃した3DサンプルMに関連付けられた3D基準サンプルRは、所与のメートルに応じて、Mの最も近くに隣接するものであり得る。
【0036】
実施形態によれば、エンコーダENCは、次いで、当該3D基準サンプルRの空間位置および属性に従って決定される差として、見逃した3DサンプルMの空間位置、およびそれらの属性を符号化することができる。
【0037】
変形例では、それらの差は、別個に符号化されてもよい。
【0038】
例えば、見逃した3DサンプルMの場合、空間座標x(M)、y(M)、およびz(M)を用いて、x−座標差Dx(M)、y−座標位置差Dy(M)、z−差Dz(M)、R−属性成分差Dr(M)、G−属性成分差Dg(M)、およびB−属性成分差Db(M)は、以下のように、計算することができる。
Dx(M)=x(M)−x(R)、
ここで、x(M)は、
図3により与えられる幾何形状画像における3DサンプルMのx−座標であり、Rについても、それぞれ同様であり、
Dy(M)=y(M)−y(R)
ここで、y(M)は、
図3により与えられる幾何形状画像における3DサンプルMのy−座標であり、Rについても、それぞれ同様であり、
Dz(M)=z(M)−z(R)
ここで、z(M)は、
図3により与えられる幾何形状画像における3DサンプルMのz−座標であり、Rについても、それぞれ同様であり、
Dr(M)=R(M)−R(R)。
ここで、R(M)、R(R)は、それぞれ、3DサンプルM、R、それぞれの色属性のr−色成分であり、
Dg(M)=G(M)−G(R)。
ここで、G(M)、G(R)は、それぞれ、3DサンプルM、R、それぞれの色属性のg−色成分であり、
Db(M)=B(M)−B(R)。
ここで、B(M)、B(R)は、それぞれ、3DサンプルM、R、それぞれの色属性のb−色成分である。
【0039】
図2は、本実施形態のうちの少なくとも1つに従う、2層ベースの点群復号化構造2000の例の概略ブロック図を示す。
【0040】
2層ベースの点群復号化構造2000の動作は、その能力に依存する。
【0041】
限定された能力を有する2層ベースの点群復号化構造2000は、多重分離デバイスDMUXを使用することによって、ビットストリームBからベース層BLのみにアクセスし得、次いで、
図4に示すように、点群デコーダ4000によりベース層BLを復号化することによって、入力点群フレームIPCFの忠実な(ただし、不可逆な)バージョンRPCFを提供することができる。
【0042】
完全な能力を有する2層ベースの点群復号化構造2000は、多重分離デバイスDMUXを使用することによって、ビットストリームBからベース層BLおよびエンハンスメント層ELの両方にアクセスすることができる。
図4に示すように、点群デコーダ4000は、ベース層BLから、再構築された点群フレームRPCFを決定することができる。デコーダDECは、エンハンスメント層ELから相補形点群フレームCPCFを決定することができる。次いで、結合器COMは、再構築された点群フレームRPCF、および相補形点群フレームCPCFを共に結合して、したがって、入力点群フレームIPCFの可逆的な(またはより高品質な)表現(再構築)CRPCFを提供することができる。
【0043】
図3は、本実施形態のうちの少なくとも1つに従う、画像ベースの点群エンコーダ3000の例の概略ブロック図を示す。
【0044】
画像ベースの点群エンコーダ3000は、既存のビデオコーデックを活用し、動的点群の幾何形状およびテクスチャ(属性)情報を圧縮する。これは、点群データを一組の異なるビデオシーケンスに実質的に変換することによって達成される。
【0045】
特定の実施形態では、2つのビデオ、すなわち、点群データの幾何形状情報を取り込むための一つのビデオ、およびテクスチャ情報を取り込むための別のビデオが、既存のビデオコーデックを使用して生成および圧縮され得る。既存のビデオコーデックの例としては、HEVCメインプロファイルエンコーダ/デコーダ(ITU−T H.265 ITU電気通信標準化部門(02/2018)、シリーズH、すなわち、視聴覚およびマルチメディアシステム、視聴覚サービスのインフラストラクチャ−ビデオ動画の符号化、高効率ビデオ符号化、勧告ITU−T H.265)がある。
【0046】
2つのビデオを解釈するために使用される追加のメタデータもまた、通常、別個に生成および圧縮される。このような追加のメタデータは、例えば、占有率マップOMおよび/または補助パッチ情報PIを含む。
【0047】
次いで、生成されたビデオビットストリームおよびメタデータは、共に多重化されて結合されたビットストリームを生成することができる。
【0048】
メタデータは、通常、情報全体のわずかな量を表すことに留意されたい。情報の大部分は、ビデオビットストリーム内にある。
【0049】
係る点群符号化/復号化プロセスの例は、ISO/IECJTC1/SC29/WG11MPEG2018/N18030、およびN17996(2018年10月、マカオ)で規定されているように、試験モデルカテゴリ2アルゴリズム(V−PCCとも表記される)によって与えられる。
【0050】
ステップ3100において、パッチ生成モジュールPGMは、最善の圧縮を提供する方策を使用して、入力点群フレームIPCFを表す3Dサンプルのデータセットを、所与の投影面上の2Dサンプルに分解することによって、少なくとも1つのパッチを生成することができる。
【0051】
パッチは、一組の2Dサンプルとして定義され得る。
【0052】
例えば、V−PCCでは、例えば、Hoppeらの報告(Hugues Hoppe、Tony DeRose、Tom Duchamp、John McDonald、Werner Stuetzle、Surface reconstruction from unorganized points、ACMSIGGRAPH 1992 Proceedings、71−78)に記載されているように、3Dサンプル毎の法線は、最初に推定される。次に、入力点群フレームIPCFの初期のクラスタ化は、入力点群フレームIPCFの3Dサンプルを取り囲む3D境界ボックスの6つの配向面のうちの1つに各3Dサンプルを関連付けることによって、取得される。より正確には、各3Dサンプルは、クラスタ化され、最も近い法線(点法線および面法線のドット積を最大化する)を有する配向面に関連付けられる。次いで、3Dサンプルは、それらの関連した平面に投影される。それらの平面内で接続領域を形成する一組の3Dサンプルは、接続された成分と呼ばれる。接続された成分は、同様の法線および同じ関連する配向面を有する少なくとも1つの3Dサンプルの一組である。次いで、初期のクラスタ化は、各3Dサンプルに関連付けられたクラスタを、その法線、およびその最も近い隣接するサンプルのクラスタに基づいて、繰り返し更新することによって、精緻化される。最終ステップは、各接続された成分から1つのパッチを生成することからなり、それは、各接続された成分の3Dサンプルを、当該接続された成分に関連付けられた配向面上に投影することによって、実行される。
【0053】
図3aは、ステップ3100の実施形態に従うパッチ生成の例を概略的に示し、そこでは、点群フレーム(ここでは、2D点群フレーム)が、4つの接続された成分、すなわち、明るい灰色の長方形(サンプル)を構成する第1の接続された成分、暗い灰色の長方形を構成する第2の接続された成分、斜線からなる長方形を構成する第3の接続された成分、および点からなる長方形を構成する第4の接続された成分にセグメント化されている。図に示すように、第1の接続された成分は、垂直な「線」上に投影され(図示した例では、2Dサンプル(同時に、3Dサンプルではない)が、線(同時に、平面ではない)に沿って投影される)、その結果、投影線内にいくつかの空間位置が、2つ以上の深度値、この例では、最大3つの深度値を有することとなる。次いで、3つのパッチ#1、#2、および#3が生成されて、第1の接続された成分に対してすべての投影された情報(深度)を取り込む。
【0054】
パッチが、補助パッチ情報PIに関連付けられており、その補助パッチ情報は、各パッチが、幾何形状および/または属性情報に対応する投影された2Dサンプルを解釈するように定義された補助パッチ情報を表す。
【0055】
V−PCCにおいて、例えば、補助パッチ情報PIは、1)接続された成分の3Dサンプルを取り囲む、3D境界ボックスの6つの配向面のうちの1つを示す情報、2)平面法線に関する情報、3)深度、接線シフト、および両接線シフトに換算して表されたパッチに対して、接続された成分の3D位置を決定する情報、および4)パッチを取り囲む2D境界ボックスを定義する投影面における座標(u0,v0,u1,v1)などの情報を含む。
【0056】
ステップ3200において、パッチパッキングモジュールPPMが、未使用空間を最小に抑える方法で、全く重なり合うことなく、少なくとも1つの生成されたパッチを2Dグリッド(キャンバスとも呼ばれる)上にマッピング(配置)することができ、2DグリッドのTxT(例えば、16x16)のブロックごとに、一意のパッチに関連付けられることを保証することができる。2Dグリッドの所与の最小ブロックサイズTxTは、この2Dグリッド上に配置される際に、別個のパッチ間の最小距離を指定することができる。2Dグリッドの解像度は、入力点群サイズに依存し得、その幅Wおよび高さH、ならびにブロックサイズTは、メタデータとしてデコーダに送信され得る。
【0057】
補助パッチ情報PIは、2Dグリッドのブロックとパッチとの間の関連付けに関する情報をさらに含むことができる。
【0058】
V−PCCにおいて、補助情報PIは、2Dグリッドのブロックとパッチインデックスとの間の関連付けを決定するパッチインデックス情報へのブロックを含む。
【0059】
パッチに属する2Dサンプルを包含するTxTブロックは、対応する占有率マップOM内の占有ブロックと見なし得る。次いで、占有率マップOMのブロックは、ブロックが占有されているかどうか、すなわち、パッチに属する2Dサンプルを包含するかどうかを示すことができる。
【0060】
画像生成プロセス(ステップ3300および3400)は、少なくとも1つの生成されたパッチの、ステップ3200中に計算された2Dグリッド上へのマッピングを有効活用して、入力点群フレームIPCFの幾何形状およびテクスチャを画像として格納する。
【0061】
ステップ3300において、幾何形状画像生成器GIGは、入力点群フレームIPCF、占有率マップOM、および補助パッチ情報PIから、少なくとも1つの幾何形状画像GIを生成することができる。幾何形状画像生成器GIGは、占有率マップ情報を有効活用して、占有されたブロック、したがって、幾何形状画像GI内の空でない画素を検出(配置)することができる。
【0062】
幾何形状画像GIは、入力点群フレームIPCFの幾何形状を表すことができ、例えば、YUV420−8ビット形式で表されるWxH画素の単色画像とすることができる。
【0063】
複数の3Dサンプルが(同じ投影方向(線)に沿って)投影面の同じ2Dサンプルに投影(マッピング)される場合をよりうまく処理するために、層と呼ばれる複数の画像が生成され得る。したがって、パッチの2Dサンプルは、関連付けられる異なる深度値D1、・・・、Dnを有することができ、複数の幾何形状画像が生成される。
【0064】
V−PCCにおいて、パッチの2Dサンプルは、2層上に投影される。第1の層は、近い層とも呼ばれるが、例えば、最も低い深度を有する2Dサンプルに関連付けられた深度値D0を格納することができる。第2の層は、遠い層と呼ばれるが、例えば、最も高い深度を有する2Dサンプルに関連付けられた深度値D1と、D0との間の差を格納することができる。したがって、第2の深度画像により格納される情報は、[D0,D0+Δ]の範囲内の深度値に対応する間隔[0,Δ]内にあり、ここで、Δは、表面厚さを表す、ユーザ定義されたパラメータである。
【0065】
このようにして、第2の層は、著しい起伏状の頻度の高い特徴を含み得る。したがって、第2の深度画像は、旧来のビデオコーダを使用することによって符号化されることは、極めて難しく、それゆえに、深度値は、当該復号化される第2の深度画像から十分に再構築されず、結果として、再構築された点群フレームの幾何形状の質が悪いことが明らかに見える。
【0066】
実施形態によれば、幾何形状画像生成モジュールGIGは、補助パッチ情報PIを使用することによって、第1および第2の層の2Dサンプルに関連付けられた深度値を符号化(導出)することができる。
【0067】
V−PCCにおいて、対応する接続された成分を有するパッチ内の3Dサンプルの位置は、深度δ(u,v)、接線シフトs(u,v)、および両接線シフトr(u,v)に換算して、以下のように表され得る。
δ(u,v)=δ0+g(u,v)
s(u,v)=s0−u0+u
r(u,v)=r0−v0+v
ここで、g(u、v)は、幾何形状画像のルーマ成分であり、(u,v)は、投影面上の3Dサンプルに関連付けられた画素であり、(δ0,s0,r0)は、3Dサンプルが属する接続された成分の対応するパッチの3D位置であり、(u0,v0,u1,v1)は、当該接続された成分に関連付けられたパッチの投影を包含する2D境界ボックスを画定する、当該投影面内の座標である。
【0068】
したがって、幾何形状画像生成モジュールGIGは、g(u,v)=δ(u,v)−δ0によって与えられるルーマ成分g(u,v)として、層(第1もしくは第2、またはその両方)の2Dサンプルに関連付けられた深度値を符号化(導出)することができる。この関係を用いると、付随する補助パッチ情報PIを使って、再構築された幾何形状画像g(u,v)から3Dサンプル位置(δ0,s0,r0)を再構築することができることに留意する。
【0069】
実施形態によれば、投影モードを使用して、第1の幾何形状画像GI0が第1または第2の層のいずれかの2Dサンプルの深度値を格納し得るかどうか、また第2の幾何形状画像GI1が第2または第1の層のいずれかの2Dサンプルに関連付けられた深度値を格納し得るかどうかを示すことができる。
【0070】
例えば、投影モードが0に等しいとき、第1の幾何形状画像GI0は、第1の層の2Dサンプルの深度値を格納し得、第2の幾何形状画像GI1は、第2の層の2Dサンプルに関連付けられた深度値を格納し得る。相反的に、投影モードが1に等しいとき、第1の幾何形状画像GI0は、第2の2Dサンプルの深度値を格納し得、第2の幾何形状画像GI1は、第1の層の2Dサンプルに関連付けられた深度値を格納し得る。
【0071】
実施形態によれば、フレーム投影モードを使用して、固定投影モードがすべてのパッチに使用されているかどうか、または各パッチが異なる投影モードを使用し得る可変投影モードが使用されているかどうかを示すことができる。
【0072】
投影モードおよび/またはフレーム投影モードは、メタデータとして送信され得る。
【0073】
フレーム投影モード決定アルゴリズムが、例えば、V−PCCのセクション2.2.1.3.1で提供され得る。
【0074】
実施形態によれば、フレーム投影が可変投影モードを使用し得ることを示すとき、パッチ投影モードを使用して、パッチを投影する(復元する)ために使用する適切なモードを示すことができる。
【0075】
パッチ投影モードは、メタデータとして送信され得、場合によっては、補助パッチ情報PI内に含まれる情報であってもよい。
【0076】
パッチ投影モード決定アルゴリズムが、V−PCCのセクション2.2.1.3.2内に例として提供されている。
【0077】
いくつかの幾何形状層の使用は、所与の層数が十分でない場合、依然として、点群フレームの幾何形状を適切に取り込まない場合がある。しかし、層数を増やすことにより、全体的なビットレートを上昇させ、したがって、圧縮効率を低下させる。
【0078】
ステップ3400において、テクスチャ画像生成器TIGは、入力点群フレームIPCFからの少なくとも1つのテクスチャ画像TI、占有率マップOM、補助パッチ情報PI、および少なくとも1つの復号化された幾何形状画像DGI、すなわちビデオデコーダVDEC(
図4のステップ4200)の出力から導出された、再構築された点群フレームの幾何形状を生成することができる。
【0079】
テクスチャ画像TIは、入力点群フレームIPCFのテクスチャを表し得、例えば、YUV420−8ビット形式で表されるWxH画素の画像であってもよい。
【0080】
テクスチャ画像生成器TGは、占有率マップ情報を有効活用して、占有されたブロック、したがって、テクスチャ画像内の空でない画素を検出(配置)することができる。
【0081】
テクスチャ画像生成器TIGは、テクスチャ画像TIを生成し、そのテクスチャ画像を各幾何形状画像/層DGIに関連付けるように適合され得る。
【0082】
実施形態によれば、テクスチャ画像生成器TIGは、第1の層の2Dサンプルに関連付けられたテクスチャ(属性)値T0を、第1のテクスチャ画像TI0の画素値として、また第2の層の2Dサンプルに関連付けられたテクスチャ値T1を、第2のテクスチャ画像TI1の画素値として、符号化(格納)することができる。
【0083】
別の方法として、テクスチャ画像生成モジュールTIGは、第2の層の2Dサンプルに関連付けられたテクスチャ値T1を、第1のテクスチャ画像TI0の画素値として、また第1の層の2Dサンプルに関連付けられたテクスチャ値D0を、第2の幾何形状画像GI1の画素値として、符号化(格納)することができる。
【0084】
例えば、3Dサンプルの色は、V−PCCのセクション2.2.3、2.2.4、2.2.5、2.2.8、または2.5で説明されているように、取得され得る。
【0085】
実施形態によれば、パディングプロセスが、幾何形状および/またはテクスチャ画像上で適用され得る。パッチ間の空白を埋める目的は、ビデオ圧縮に適した区分の滑らかな画像を生成することである。
【0086】
画像パディングの例が、V−PCCのセクション2.2.6および2.2.7で提供されている。
【0087】
ステップ3500において、ビデオエンコーダVENCは、生成された画像/層TIおよびGIを符号化することができる。
【0088】
ステップ3600において、エンコーダOMENCは、例えば、V−PCCのセクション2.2.2に詳述されているように、占有率マップを画像として符号化することができる。不可逆的または可逆的符号化を使用することができる。
【0089】
実施形態によれば、ビデオエンコーダENCおよび/またはOMENCは、HEVCベースのエンコーダであってもよい。
【0090】
ステップ3700において、エンコーダPIENCは、補助パッチ情報PI、ならびに幾何形状/テクスチャ画像のブロックサイズT、幅W、および高さHなどの、追加の可能性のあるメタデータを符号化することができる。
【0091】
実施形態によれば、補助パッチ情報は、差動的に符号化されてもよい(例えば、V−PCCのセクション2.4.1で定義されているように)。
【0092】
ステップ3800において、多重化デバイスが、ステップ3500、3600、および3700の出力である生成されたビデオビットストリームを共に多重化して、ベース層BLで表すビットストリームを生成することができる。メタデータ情報は、ビットストリーム全体のうちのわずかな割合を表すことに留意されたい。情報の大部分は、ビデオコーデックを使用して圧縮される。
【0093】
図4は、本実施形態のうちの少なくとも1つに従う、画像ベースの点群デコーダ4000の例の概略ブロック図を示す。
【0094】
ステップ4100において、多重分離デバイスDMUXは、ベース層BLを表すビットストリームの符号化された情報にアクセスすることができる。
【0095】
ステップ4200において、ビデオデコーダVDECは、符号化された情報を復号化して、少なくとも1つの復号化された幾何形状画像DGI、および少なくとも1つの復号化されたテクスチャ画像DTIを導出することができる。
【0096】
ステップ4300において、デコーダOMDECが、符号化された情報を復号化して、復号化された占有率マップDOMを導出することができる。
【0097】
実施形態によれば、ビデオデコーダVDECおよび/またはOMDECは、HEVCベースのデコーダであってもよい。
【0098】
ステップ4400において、デコーダPIDECが、符号化された情報を復号化して、補助パッチ情報DPIを導出することができる。
【0099】
場合によっては、メタデータもまた、ビットストリームBLから導出され得る。
【0100】
ステップ4500において、幾何形状生成モジュールGGMは、少なくとも1つの復号化された幾何形状画像DGI、復号化された占有率マップDOM、復号化された補助パッチ情報DPI、および可能性のある追加のメタデータから、再構築された点群フレームRPCF(またはIRPCF)の幾何形状RGを導出することができる。
【0101】
幾何形状生成モジュールGGMは、復号化された占有率マップ情報DOMを有効に活用して、少なくとも1つの復号化された幾何形状画像DGI内の空でない画素を見つけ出すことができる。次いで、空でない画素に関連付けられた再構築された3Dサンプルの3D座標は、当該空でない画素の座標、および当該再構築された2Dサンプルの値から導出され得る。
【0102】
実施形態によれば、幾何形状生成モジュールGGMは、空でない画素の座標から、再構築された3Dサンプルの3D座標を導出することができる。
【0103】
実施形態によれば、幾何形状生成モジュールGGMは、空でない画素の座標、少なくとも1つの復号化された幾何形状画像DGのうちの1つの当該空でない画素の値、復号化された補助パッチ情報から、および場合によっては、追加のメタデータから、再構築された3Dサンプルの3D座標を導出することができる。
【0104】
空でない画素の使用は、2D画素の、3Dサンプルとの関係に基づいている。例えば、V−PCC内の当該投影を使って、再構築された3Dサンプルの3D座標は、深度δ(u,v)、接線シフトs(u,v)、および両接線シフトr(u,v)に換算して、以下のように表され得る。
δ(u,v)=δ0+g(u,v)
s(u,v)=s0−u0+u
r(u,v)=r0−v0+v
ここで、g(u、v)は、復号化された幾何形状画像DGIのルーマ成分であり、(u,v)は、再構築された3Dサンプルに関連付けられた画素であり、(δ0,s0,r0)は、再構築された3Dサンプルが属する接続された成分の3D位置であり、(u0,v0,u1,v1)は、当該接続された成分に関連付けられたパッチの投影を包含する2D境界ボックスを画定する、投影面内の座標である。
【0105】
ステップ4600において、テクスチャ生成モジュールTGMは、幾何形状RG、および少なくとも1つの復号化されたテクスチャ画像DTIから、再構築された点群フレームRPCF(またはIRPCF)のテクスチャを導出することができる。
【0106】
図5は、本実施形態のうちの少なくとも1つに従う、ベース層BLを表すビットストリームの例示的なシンタックスを概略的に示す。
【0107】
ビットストリームは、ビットストリームヘッダBSH、および少なくとも1つのフレームストリームグループGOFSを含む。
【0108】
フレームストリームグループGOFSは、ヘッダHS、占有率マップOMを表す少なくとも1つのシンタックス要素OMS、少なくとも1つの幾何形状画像(またはビデオ)を表す少なくとも1つのシンタックス要素GVS、少なくとも1つのテクスチャ画像(またはビデオ)を表す少なくとも1つのシンタックス要素TVS、および補助パッチ情報を表す少なくとも1つのシンタックス要素PIS、ならびに他の追加のメタデータを含む。
【0109】
変形例では、フレームストリームグループGOFSは、少なくとも1つのフレームストリームを含む。
【0110】
図6は、様々な態様および実施形態が実装されるシステムの例を例証する概略ブロック図を示す。
【0111】
システム6000は、以下に説明されている様々なコンポーネントを含む1つ以上のデバイスとして具現化され得、本文書に記載されている態様のうちの1つ以上を実行するように構成されている。システム6000のすべてまたは一部を形成し得る機器の例としては、パーソナルコンピュータ、ラップトップ、スマートフォン、タブレットコンピュータ、デジタルマルチメディアセットトップボックス、デジタルテレビジョン受信機、パーソナルビデオレコーディングシステム、接続された家庭電化製品、ヘッドマウントディスプレイデバイス(HMD、シースルーグラス)、プロジェクタ(ビーマー)、「没入型バーチャルリアリティー体験装置(caves)」(複数のディスプレイを含むシステム)、サーバ、ビデオエンコーダ、ビデオデコーダ、ビデオデコーダから出力されるポストプロセッサ処理、ビデオエンコーダへの入力を提供するプリプロセッサ、ウェブサーバ、セットトップボックス、および点群、ビデオ、もしくは画像を処理するための任意の他のデバイス、または他の通信デバイスが含まれる。システム6000の要素は、単独で、または組み合わされて、単一の集積回路、複数のIC、および/または個別のコンポーネントで具現化されてもよい。例えば、少なくとも1つの実施形態では、システム6000の処理およびエンコーダ/デコーダ要素は、複数のICおよび/または個別のコンポーネントにわたって分散されてもよい。様々な実施形態では、システム6000は、例えば、通信バスを介して、または専用の入力または出力ポートを通じて、他の同様のシステムに、または他の電子デバイスに通信可能に結合されてもよい。様々な実施形態では、システム6000は、本文書に記載された態様のうちの1つ以上を実装するように構成することができる。
【0112】
システム6000は、例えば、本文書に記載された様々な態様を実施するために、内部にロードされた命令を実行するように構成されている少なくとも1つのプロセッサ6010を含むことができる。プロセッサ6010は、埋め込み型メモリ、入力出力インターフェース、および当技術分野で既知の様々な他の回路を含むことができる。システム6000は、少なくとも1つのメモリ6020(例えば、揮発性メモリデバイスおよび/または不揮発性メモリデバイス)を含むことができる。システム6000は、記憶6040を含むことができ、その記憶装置は、不揮発性メモリおよび/または揮発性メモリを含むことができ、それらのメモリには、電気的消去可能型プログラマブルデバイス読み出し専用メモリ(EEPROM)、読み出し専用メモリ(ROM)、プログラマブル読み出し専用メモリ(PROM)、ランダムアクセスメモリ(RAM)、ダイナミックランダムアクセスメモリ(DRAM)、スタティックランダムアクセスメモリ(SRAM)、フラッシュ、磁気ディスクデバイス、および/または光ディスクデバイスが含まれるが、これらに限定されない。記憶デバイス6040には、非限定的な例として、内部記憶デバイス、接続型記憶デバイス、および/またはネットワークアクセス可能型記憶デバイスが含まれ得る。
【0113】
システム6000は、例えば、データを処理して符号化されたデータ、または復号化されたデータを提供するように構成されているエンコーダ/デコーダモジュール6030を含むことができ、エンコーダ/デコーダモジュール6030は、それ自体が保有するプロセッサおよびメモリを含むことができる。エンコーダ/デコーダモジュール6030は、デバイス内に含まれて、符号化および/または復号化機能を実行することができるモジュール(複数可)を表し得る。知られているように、デバイスが、符号化および復号化モジュールのうちの一方または両方を含んでもよい。さらに、エンコーダ/デコーダモジュール6030は、システム6000の別個の要素として実装されてもよく、または当業者にとっては既知であるように、ハードウェアおよびソフトウェアの組み合わせとして、プロセッサ6010内に組み込まれてもよい。
【0114】
本文書に記載された様々な態様を実行するためのプロセッサ6010またはエンコーダ/デコーダ6030にロードされるプログラムコードは、記憶デバイス6040内に格納され得、その後、プロセッサ6010による実行のためのメモリ6020上にロードされ得る。様々な実施形態によれば、プロセッサ6010、メモリ6020、記憶デバイス6040、およびエンコーダ/デコーダモジュール6030のうちの1つ以上が、本文書に記載されたプロセスの実行中に、様々な項目のうちの1つ以上を格納することができる。係る格納される項目には、点群フレーム、符号化/復号化された幾何形状/テクスチャビデオ/画像もしくは符号化/復号化された幾何形状/テクスチャビデオ/画像の一部、ビットストリーム、行列、変数、ならびに数式、公式、演算、および演算ロジックの処理からの中間もしくは最終結果が含まれ得るが、これらに限定されない。
【0115】
いくつかの実施形態では、プロセッサ6010および/またはエンコーダ/デコーダモジュール6030内部のメモリを使用して、命令を格納し、符号化または復号化中に実行され得る処理のための作業メモリを提供することができる。
【0116】
しかしながら、他の実施形態では、処理デバイス(例えば、処理デバイスは、プロセッサ6010またはエンコーダ/デコーダモジュール6030のいずれかであり得る)の外部にあるメモリは、これらの機能のうちの1つ以上に使用され得る。外部メモリは、メモリ6020および/または記憶デバイス6040、例えば、ダイナミック揮発性メモリおよび/または不揮発性フラッシュメモリであってもよい。いくつかの実施形態では、外部不揮発性フラッシュメモリを使用して、テレビジョンのオペレーティングシステムを格納することができる。少なくとも1つの実施形態では、RAMなどの高速外部ダイナミック揮発性メモリは、MPEG−2パート2(ITU−T勧告H.262およびISO/IEC13818−2としても知られており、MPEG−2ビデオとしても知られている)、HEVC(高効率ビデオ符号化)、またはVVC(多機能ビデオ符号化)用などのビデオ符号化および復号化動作のための作業メモリとして使用することができる。
【0117】
システム6000の要素への入力は、ブロック6130に示されているように、様々な入力デバイスを介して提供され得る。係る入力デバイスには、(i)例えば、放送局による、空中をわたって送信されるRF信号を受信し得るRF部分、(ii)複合入力端子、(iii)USB入力端子、および/または(iv)HDMI入力端子が含まれるが、これらに限定されない。
【0118】
様々な実施形態では、ブロック6130の入力デバイスは、当技術分野で既知の、関連するそれぞれの入力処理要素を有してもよい。例えば、RF部分は、(i)所望の周波数を選択する(信号を選択する、または信号を周波数帯域に帯域制限するとも称される)、(ii)選択された信号をダウンコンバートする、(iii)特定の実施形態で、(例えば)チャネルと称され得る信号周波数帯域を選択するために、再びより狭い周波数帯域に帯域制限する、(iv)ダウンコンバートおよび帯域制限された信号を復調する、(v)誤り訂正を実行する、および(vi)データパケットの所望のストリームを選択するために多重分離する、ために必要な要素に関連付けられてもよい。様々な実施形態のRF部分は、これらの機能を実行する1つ以上の要素、例えば、周波数セレクタ、信号セレクタ、帯域リミッタ、チャネルセレクタ、フィルタ、ダウンコンバータ、復調器、エラーコレクタ、および多重分離デバイスを含むことができる。RF部分は、これらの様々な機能を実行するチューナを含むことができ、例えば、受信した信号をより低い周波数(例えば、中間周波数または近接ベースバンド周波数)に、またはベースバンドにダウンコンバートすることが含まれる。
【0119】
1つのセットトップボックスの実施形態では、RF部分およびその関連付けられた入力処理要素は、有線(例えば、ケーブル)媒体を経由して送信されるRF信号を受信することができる。次いで、RF部分は、所望の周波数帯域へのフィルタリング、ダウンコンバーティング、および再度のフィルタリングによって、周波数選択を実行することができる。
【0120】
様々な実施形態が、上述の(および他の)要素の順番を並べ替え、これらの要素の一部を取り除き、かつ/または同様のもしくは異なる機能を実行する他の要素を追加する。
【0121】
要素を追加することには、既存の要素の間に要素を挿入すること、例えば、増幅器およびアナログデジタルコンバータを挿入することなどが含まれ得る。様々な実施形態では、RF部分は、アンテナを含むことができる。
【0122】
追加的に、USBおよび/またはHDMI端末は、USBおよび/またはHDMI接続全体にわたって、システム6000を他の電子デバイスに接続するためのそれぞれのインターフェースプロセッサを含むことができる。例えば、リードソロモン誤り訂正の入力処理の様々な態様は、例えば、別個の入力処理IC内に、または必要に応じて、プロセッサ6010内に実装されてもよいことを理解されたい。同様に、USBまたはHDMIインターフェース処理の態様は、別個のインターフェースIC内に、または必要に応じて、プロセッサ6010内に実装されてもよい。復調され、誤り訂正され、そして多重分離されたストリームは、様々な処理要素に提供され得、その要素には、例えば、プロセッサ6010、ならびに必要に応じて出力デバイスに提示するために、データストリームを処理するためのメモリおよび記憶要素と組み合わせて動作するエンコーダ/デコーダ6030が含まれる。
【0123】
システム6000の様々な要素が、統合されたハウジング内に提供され得る。統合されたハウジング内では、様々な要素が、適切な接続配置6140を使用して相互接続され、かつ互いの間でデータを送信することができ、その接続配置としては、例えば、当技術分野で既知の内部バスがあり、I2Cバス、配線、およびプリント回路基板が含まれる。
【0124】
システム6000は、通信インターフェース6050を含み得、その通信インターフェースは、通信チャネル6060を介して、他のデバイスとの通信を可能にする。通信インターフェース6050は、通信チャネル3060を介してデータを送受信するように構成された送受信機を含み得るが、これに限定されない。通信インターフェース6050は、モデムまたはネットワークカードを含み得るが、これに限定されず、通信チャネル6060は、例えば、有線および/または無線媒体内に実装され得る。
【0125】
様々な実施形態において、データは、IEEE802.11などのWi−Fiネットワークを使用して、システム6000にストリーム伝送され得る。これらの実施形態のWi−Fi信号は、Wi−Fi通信のために適合されている通信チャネル6060および通信インターフェース6050を介して受信され得る。これらの実施形態の通信チャネル6060は、通常、外部ネットワークへのアクセスを提供するアクセスポイントまたはルータに接続され得、その外部ネットワークには、ストリーミングアプリケーションおよび他のオーバーザトップ通信を可能にするためのインターネットが含まれる。
【0126】
他の実施形態は、入力ブロック6130のHDMI接続を介してデータを送達するセットトップボックスを使用して、ストリームデータをシステム6000に提供することができる。
【0127】
さらなる他の実施形態が、入力ブロック6130のRF接続を使用して、ストリームデータをシステム6000に提供することができる。
【0128】
信号伝達は、様々な方法で達成され得ることを理解されたい。例えば、様々な実施形態において、1つ以上のシンタックス要素、フラグなどを使用して、情報を、対応するデコーダに信号伝達することができる。
【0129】
システム6000は、出力信号を、ディスプレイ6100、スピーカー6110、および他の周辺デバイス6120を含む様々な出力デバイスに提供することができる。他の周辺デバイス6120には、様々な実施形態の例において、スタンドアロン型DVR、ディスクプレーヤー、ステレオシステム、照明システム、およびシステム3000の出力に基づいて機能を提供する他のデバイスのうちの1つ以上が含まれ得る。
【0130】
様々な実施形態では、制御信号が、AVリンク(オーディオ/ビデオリンク)、CEC(家電製品制御)、またはユーザの関与の有無を問わずデバイス間制御を可能にする他の通信プロトコルなどの信号方式を使用して、システム3000と、ディスプレイ6100、スピーカー6110、または他の周辺デバイス6120との間で伝達され得る。
【0131】
出力デバイスは、それぞれのインターフェース6070、6080、および6090を通じた専用接続を介して、システム6000に通信可能に結合され得る。
【0132】
別の方法として、出力デバイスは、通信インターフェース6050を介して、通信チャネル6060を使用して、システム3000に接続され得る。ディスプレイ6100およびスピーカー6110は、例えば、テレビジョンなどの電子デバイス内のシステム6000の他のコンポーネントと共に単一ユニット内に一体化されてもよい。
【0133】
様々な実施形態では、ディスプレイインターフェース6070は、例えば、タイミングコントローラ(TCon)チップなどのディスプレイドライバを含むことができる。
【0134】
ディスプレイ6100およびスピーカー6110は、別の方法として、例えば、入力6130のRF部分が別個のセットトップボックスの一部である場合、他のコンポーネントのうちの1つ以上から分離されてもよい。ディスプレイ6100およびスピーカー6110が外部コンポーネントであり得る様々な実施形態では、出力信号は、例えば、HDMIポート、USBポート、またはCOMP出力を含む、専用の出力接続を介して提供され得る。
【0135】
図7は、本実施形態のうちの少なくとも1つに従う、少なくとも1つの3Dサンプル(スタッフィング3Dサンプルと称される)を点群フレームPCFに追加するための方法の例の概略ブロック図を示す。
【0136】
当該点群フレームPCFは、例えば、少なくとも1つの復号化された幾何形状画像DGIから導出された再構築された点群フレームであり、例えば、中間の再構築された点群IRPCF、再構築された点群フレームRPCF、または
図3の少なくとも1つの復号化された幾何形状画像DGIから導出された再構築された点群フレームである。
【0137】
ステップ7100において、モジュールは、少なくとも1つのスタッフィング3Dサンプルが点群フレームPCFに追加される必要があるかどうかを判定する。
【0138】
ステップ7100の実施形態によれば、少なくとも1つのスタッフィング3Dサンプルは、当該現在の3Dサンプルの隣接する3Dサンプルの深度値と、当該現在の3Dサンプルの深度値との間の差に従って、点群フレームPCFの現在の3Dサンプルから追加され得る。
【0139】
スタッフィング3Dサンプルが、ステップ7200において、追加される必要がある場合、色分けモードが、当該スタッフィング3Dサンプルに割り当てられる。当該色分けモードは、当該3Dサンプルに関連付けられた色情報がビットストリームで明示的に符号化されているかどうか(明示的色分けモード)、または色情報が暗黙的であるかどうか(暗黙的色分けモード)、すなわち、当該色情報が、点群フレームPCTの3Dサンプルを含む他の3Dサンプル、場合によっては他のスタッフィング3Dサンプルに関連付けられた色情報から導出されるかどうか、を示す。
【0140】
スタッフィング3Dサンプルに割り当てられた色情報が明示的に符号化されるか否かを判定することは、品質(明示的に符号化する場合)とビットレート低下(暗黙的である場合)との間のトレードオフである。
【0141】
ステップ7300において、スタッフィング3Dサンプルに関連付けられた色情報は、明示的な色分けモードが当該スタッフィング3Dサンプルに関連付けられている場合、ビットストリームで符号化される。
【0142】
ステップ7400において、任意選択的に、色分けモードは、ビットストリームで符号化される。
【0143】
図7の方法は、スタッフィング3Dサンプルを使用することが、
図8に示すように、点群フレームの幾何形状を適切に取り込むのに必要とされる幾何形状画像(層)の数を減少させるため、ビットレートの観点では、特に有利である。したがって、極めて限定された数の幾何形状画像を符号化し、3Dサンプルに詰め込むことは、点群フレームの幾何形状を取り込むために幾何形状画像のみを使用する方法と比較して、ビットレート全体を低下させる。
【0144】
図8は、
図7の方法の少なくとも1つの実施形態に従って処理された、
図3aの接続された成分の例を概略的に示す。
【0145】
明るい灰色の長方形により表された第1の接続された成分に対して(
図3a)、すべての投影された情報を取り込むために(最大)3つのパッチを保持するのではなく、単一の層が、
図7の方法に従って保持されており(パッチ#1)、例えば、そのパッチは第1の層に対応し、第1の層は、最も低い深度を有する2Dサンプルに関連付けられた深度値D0を格納する層である。次いで、当該パッチ#1は、投影が復元され、その復元された接続された成分を分析して、少なくとも1つのスタッフィング3Dサンプルによって次に埋め込まれる潜在的なホールを検出する。この例によれば、3つのスタッフィング3DサンプルP1、P2、およびP3が追加される。
【0146】
図7aに示すように、ステップ7100の実施形態によれば、スタッフィング3Dサンプルを追加することは、以下のサブステップを含む。
サブステップ7110において、点群PCFのうちの少なくとも1つの現在の3DサンプルCurの場合、現在の3Dサンプルの深度値Depth(Cur)と、当該現在の3Dサンプルの隣接する3DサンプルNiの深度値Depth(Ni)との間の最大深度差(距離)deltaMax(Cur)が、計算される。
deltaMax(Cur)=max(Depth(Ni)−Depth(Cur))
ここで、Niは、現在の3DサンプルCurのi番目の隣接する3Dサンプルを示し、max(a,b)は、2つの値aとbとの間の通常の最大値関数である。
【0147】
サブステップ7110の実施形態によれば、隣接する3DサンプルNiは、現在の3Dサンプルを中心とするNxN付近に属する。
【0148】
サブステップ7110の変形例によれば、幾何形状画像面への隣接する3DサンプルNiの投影、および当該幾何形状画像面への現在の3DサンプルCurの投影は、同じ幾何形状画像(同じ層)の同じパッチに属する。
【0149】
サブステップ7110の変形例によれば、幾何形状画像面への隣接する3DサンプルNiの投影、および当該幾何形状画像面への現在の3DサンプルCurの投影は、同じ幾何形状画像(同じ層)の異なるパッチに属する。
【0150】
サブステップ7110の変形例、第1の幾何形状画像面への隣接する3DサンプルNiの投影、および第2の幾何形状画像面への現在の3DサンプルCurの投影によれば、当該第1および第2の幾何形状画像面は、異なる幾何形状画像(異なる層)に対応する。例えば、当該幾何形状画像のうちの1つは、最も低い深度を有する2Dサンプルに関連付けられた深度値D0を格納し(言わば、V−PCC内の第1の層)、当該幾何形状画像のうちの別のものは、最も高い深度を有する2Dサンプルに関連付けられた深度値D1を格納する(言わば、V−PCC内の第2の層)。
【0151】
サブステップ7110の変形例によれば、現在の3Dサンプルの深度値Depth(Cur)と、隣接する3DサンプルNiの深度値Depth(Ni)との差は、その差が下界LBおよび上界UBにより画定される値の所与の範囲に属さない場合に、無視される。
【0152】
例えば、LB=0およびUB=4である。
【0153】
その差が、値の所与の範囲に全く属さない場合は、最大深度差deltaMax(現在)は、0に設定されてもよい。
【0154】
サブステップ7120において、少なくとも1つのスタッフィング3Dサンプルが、深度(Cur)から深度(Cur)+deltaMax(Cur)−1の範囲にわたる深度値で追加される。
【0155】
サブステップ7120の実施形態によれば、少なくとも1つのスタッフィング3Dサンプルが、画像面上への現在の3Dサンプルの投影を表す2Dサンプルと同じ2D位置において、最大深度差deltaMax(Cur)まで追加される。したがって、(deltMax(Cur)−1)スタッフィング3Dサンプルは、Depth(Cur)からDepth(Cur)+deltaMax(Cur)−1までの範囲にわたる深度値で追加される。
【0156】
deltMax(Cur)=0または=1のとき、スタッフィング3Dサンプルもまた、当該2D位置において追加される。
【0157】
図9は、deltaMax(Cur)が0、1、2、3、および4に等しい場合の、サブステップ7110の例を概略的に示す。
【0158】
明るい灰色の長方形は、現在の3DサンプルCurを表し、ブロック長方形は、隣接する3DサンプルNiを表し、十字形は、追加されたスタッフィング3Dサンプルの場合である。現在の3DサンプルCurは、より簡単な説明例のために、単一の隣接する3DサンプルNiを有するものと仮定する。
【0159】
図9の第1の例EX1では、深度Depth(Cur)と深度Depth(Ni)との差は、5に等しく、上界UP(=4)よりも大きい。次いで、deltMax(Cur)=0、および単一のスタッフィング3Dサンプルが、現在の3Dサンプルの投影を表す2Dサンプルの2D位置として、追加される。
【0160】
図9の第2の例EX2では、深度Depth(Cur)と深度Depth(Ni)との差は、4に等しい。したがって、deltMax(Cur)=4、および3つのスタッフィング3Dサンプルが、現在の3DサンプルCurと同じ2D位置において、(最大深度差deltaMax(Cur)−1まで)追加される。
【0161】
図9の第3の例EX3では、深度Depth(Cur)と深度Depth(Ni)との差は、3に等しい。したがって、deltMax(Cur)=3、および2つのスタッフィング3Dサンプルは、現在の3DサンプルCurと同じ2D位置において、(最大深度差deltaMax(Cur)−1まで)追加される。
【0162】
図9の第4の例EX4では、深度Depth(Cur)と深度Depth(Ni)との差は、2に等しい。したがって、deltMax(Cur)=2、および1つのスタッフィング3Dサンプルが、現在の3DサンプルCurと同じ2D位置において、(最大深度差deltaMax(Cur)−1まで)追加される。
【0163】
図9の第5の例EX5では、深度Depth(Cur)と深度Depth(Ni)との差は、1に等しい。したがって、deltMax(Cur)=1、および単一のスタッフィング3Dサンプルは、現在の3Dサンプルの投影を表す、2Dサンプルの2D位置として追加される。
【0164】
図9の第6の例EX6では、深度Depth(Cur)と深度Depth(Ni)との差は、0に等しい。したがって、deltMax(Cur)=0、および単一のスタッフィング3Dサンプルは、現在の3Dサンプルの投影を表す、2Dサンプルの2D位置として追加される。
【0165】
図9の第7の例EX7では、下界LBは、0に等しく、かつ上界は、4に等しい。深度Depth(Cur)と深度Depth(Ni)との差は、−1に等しい。したがって、deltMax(Cur)=0、および単一のスタッフィング3Dサンプルは、現在の3Dサンプルの投影を表す、2Dサンプルの2D位置として追加される。
【0166】
サブステップ7120の別の実施形態によれば、少なくとも1つのスタッフィング3Dサンプルが、画像面上への現在の3Dサンプルの投影を表す2Dサンプルと同じ2D位置において、最大深度差deltaMax(Cur)−1まで追加され、別のスタッフィング3Dサンプルが、deltMax(Cur)−1に等しい深度値で隣接する3Dサンプルの投影を表す2Dサンプルとして2D位置において追加される。したがって、(deltMax(Cur)−1)スタッフィング3Dサンプルは、Depth(Cur)からDepth(Cur)+deltaMax(Cur)−1までの範囲にわたる深度値で追加される。
【0167】
図10は、deltaMax(Cur)が0、1、2、3、および4に等しい場合の、サブステップ7110の例を概略的に示す。
【0168】
明るい灰色の長方形は、現在の3DサンプルCurを表し、ブロック長方形は、隣接する3DサンプルNiを表し、十字形は、追加されたスタッフィング3Dサンプルの場合である。現在の3DサンプルCurは、より簡単な説明例のために、単一の隣接する3DサンプルNiを有するものと仮定する。
【0169】
図10の第2の例EX2では、深度Depth(Cur)と深度Depth(Ni)との差は、4に等しい。したがって、deltMax(Cur)=4、2つのスタッフィング3Dサンプルが、現在の3DサンプルCurと同じ2D位置において、(最大深度差deltaMax(Cur)−2まで)追加され、別のスタッフィング3Dサンプルが、deltMax(Cur)−1と設定された隣接する3Dサンプルの投影を表す2Dサンプルとして、2D位置において追加される。
【0170】
図10の第3の例EX3では、深度Depth(Cur)と深度Depth(Ni)との差は、3に等しい。したがって、deltMax(Cur)=3、1つのスタッフィング3Dサンプルが、現在の3DサンプルCurと同じ2D位置において、(最大深度差deltaMax(Cur)−2まで)追加され、別のスタッフィング3Dサンプルが、deltMax(Cur)−1と設定された隣接する3Dサンプルの投影を表す2Dサンプルとして、2D位置において追加される。
【0171】
他の例は、
図9で説明された例と同じままである。
【0172】
サブステップ7120の変形例によれば、最大深度差deltaMax(Cur)は、少なくとも、次の最小値minDepthに等しい。
deltaMax(Cur)=max((Depth(Ni)−Depth(Cur)),minDepth)
【0173】
例えば、minDepthは、1または2に等しくてもよい。
【0174】
この変形例は、必要に応じて、少なくとも1つのスタッフィング3Dサンプルを追加することによって、再構築された点群フレームの最小の厚さを確実にする。
【0175】
サブステップ7120の変形例によれば、minDepthの値は、少なくとも1つの追加されるスタッフィング3Dサンプルを符号化することについてのコストを推定することにより、レート/ひずみ最適化ループによって定義され得る。
【0176】
サブステップ7120の実施形態によれば、最小値MinDepthは、ビットストリームで送信(信号伝達)される。
【0177】
ステップ7300の実施形態によれば、明示的な色分けモードがスタッフィング3Dサンプルに割り当てられる場合、当該色情報は、テクスチャ画像TI内で符号化される。
【0178】
これは、忠実度を最大化し、復号化の複雑さを低減する。
【0179】
ステップ7200の実施形態によれば、色分けモードの値が、当該スタッフィング3DサンプルCurに関連付けられた最大深度差deltaMax(Cur)に従って、スタッフィング3DサンプルCurに割り当てられる。
【0180】
ステップ7200の実施形態によれば、最大深度差deltaMax(Cur)が0または1に等しい場合、明示的な色分けモードを、追加されるスタッフィング3Dサンプルに割り当てる。最大深度差deltaMax(Cur)が1より大きい場合、明示的な色分けモードを、最も高い深度値を有する追加されたスタッフィング3Dサンプルに割り当てる。最も高い深度値を有する追加されたスタッフィング3Dサンプルは、Depth(Cur)+deltaMax(Cur)−1に等しい深度値を有する追加されたスタッフィング3Dサンプルである。次いで、暗黙的な色分けモードを残りの追加されたスタッフィング3Dサンプルに割り当てる(存在する場合)。
【0181】
図11は、deltaMax(Cur)が0、1、2、3、および4に等しい場合の、ステップ7200の実施形態の例を概略的に示す。
【0182】
明るい灰色の長方形は、現在の3DサンプルCurを表し、ブロック長方形は、隣接する3DサンプルNiを表し、十字形は、追加されたスタッフィング3Dサンプルの場合であり、ハッシュされた長方形は、明示的に色分けが設定された追加されたスタッフィング3Dサンプルを表す。現在の3DサンプルCurは、より簡単な説明例のために、単一の隣接する3DサンプルNiを有するものと仮定する。
【0183】
図9の7つの例が、ここでは、非限定的な例の場合として使用される。
【0184】
図11の第1、第6、および第7の例(EX1、EX6、およびEX7)では、最大深度差deltaMax(Cur)は、0に等しく、次いで、明示的な色分けモードは、現在の3DサンプルCurの投影を表す2Dサンプルの2D位置に配置されたスタッフィング3Dサンプルに割り当てられる。
【0185】
図11の第2の例EX2では、最大深度差deltaMax(Cur)は、4に等しく、次いで、明示的な色分けモードは、最も高い深度値を有する追加されたスタッフィング3Dサンプル、すなわち、Depth(Cur)+3に等しい深度値を有する追加されたスタッフィング3Dサンプルに割り当てられる。暗黙的な色分けモードは、Depth(Cur)+2に等しい深度値を有する追加されたスタッフィング3Dサンプル、およびDepth(Cur)+1に等しい深度値を有する追加されたスタッフィング3Dサンプルに割り当てられる。
【0186】
図11の第3の例EX3では、最大深度差deltaMax(Cur)は、3に等しく、次いで、明示的な色分けモードは、最も高い深度値を有する追加されたスタッフィング3Dサンプル、すなわち、Depth(Cur)+2に等しい深度値を有する追加されたスタッフィング3Dサンプルに割り当てられる。暗黙的な色分けモードは、Depth(Cur)+1に等しい深度値を有する追加されたスタッフィング3Dサンプルに割り当てられる。
【0187】
図11の第4の例EX4では、最大深度差deltaMax(Cur)は、2に等しく、次いで、明示的色分けモードは、最も高い深度値を有する追加されたスタッフィング3Dサンプル、すなわち、Depth(Cur)+1に等しい深度値を有する追加されたスタッフィング3Dサンプルに割り当てられる。
【0188】
図11の第5の例EX5では、最大深度差deltaMax(Cur)は、1に等しく、次いで、明示的色分けモードは、最も高い深度値を有する追加されたスタッフィング3Dサンプル、すなわち、Depth(Cur)に等しい深度値を有する追加されたスタッフィング3Dサンプルに割り当てられる。
【0189】
図12に示すステップ7200の変形例の実施形態によれば、最大深度差deltaMax(Cur)が0または1に等しい場合、明示的な色分けモードは、追加されるスタッフィング3Dサンプルに割り当てられる。最大深度差deltaMax(Cur)が1より大きい場合、明示的な色分けモードを、中間深度値を有する追加されたスタッフィング3Dサンプルに割り当てる。中間深度値を有する追加されたスタッフィング3Dサンプルは、ceil(Depth(Curr)+deltaMax(Curr)/2)に等しい深度値を有する追加されたスタッフィング3Dサンプルである。次いで、暗黙的な色分けモードを残りの追加されたスタッフィング3Dサンプルに割り当てる(存在する場合)。
【0190】
ステップ7300の実施形態によれば、スタッフィング3Dサンプルに関連付けられた色分けモードが、色情報が当該スタッフィング3Dサンプルに関連付けられていることを示さない場合、スタッフィング3Dサンプルに関連付けられた色情報は、当該スタッフィング3Dサンプルの隣接する3DサンプルNiに関連付けられた色情報を補間することによって、取得される。
【0191】
この実施形態は、ビットレートを低下させている。
【0192】
図7bは、本実施形態のうちの少なくとも1つに従う、少なくとも1つの3Dサンプル(スタッフィング3Dサンプルと称する)を点群フレームPCFに追加するための方法の例の概略ブロック図を示す。
【0193】
上述したステップ7100において、モジュールは、少なくとも1つのスタッフィング3Dサンプルが点群フレームPCFに追加される必要があるかどうかを判定する。
【0194】
スタッフィング3Dサンプルが追加される必要がある場合、ステップ7500において、デコーダは、ビットストリームを復号化して、当該少なくとも1つのスタッフィング3Dサンプルに関連付けられた色分けモードを提供する。
【0195】
当該色分けモードが、当該スタッフィング3Dサンプルに関連付けられた色情報が明示的に符号化されていると示す場合、ステップ7600において、デコーダが、ビットストリームを復号化して、当該少なくとも1つのスタッフィング3Dサンプルに関連付けられた色情報を提供する。
【0196】
当該色分けモードが暗黙的である場合、ステップ7700において、モジュールが、点群フレームPCTの3Dサンプルを含む他の3Dサンプル、場合によっては、他のスタッフィング3Dサンプルに、関連付けられた色情報から色情報を導出する。
【0197】
図7aに示した、ステップ7100の実施形態および変形例は、
図7bの方法に適用される。
【0198】
さらに、
図7bの方法は、ビットストリームを復号化して、最小値minDepthを提供することを含む。
【0199】
任意の周知の補間関数を使用して、スタッフィング3Dサンプルの隣接する3Dサンプルに関連付けられた色情報を補間することができる。
【0200】
例えば、色補間関数が、隣接する3DサンプルNiに関連付けられた色情報の最大値、最小値、中間値または平均値とすることができる。加重平均が、隣接する距離から定義される重みを使って使用されてもよい。
【0201】
色補間関数の別の例が、以下の疑似コードによって与えられる。
【表1】
【表2】
【表3】
【0202】
上で疑似コードとして提示されたアルゴリズムは、色補間を必要とする再構築された点群からの現在の3Dサンプル毎に以下のステップを実行する。
−再構築された点群フレーム、例えば、IRPCF内で最も近い、着色された3Dサンプルの色および位置を見つけること;
−オリジナルの点群フレーム、例えば、IPCF内で最も近い、着色された3Dサンプルの色および位置を見つけること;
−すべての3Dサンプルの色を、それらのサンプルの重心までの距離に基づいて、平均すること(当該3Dサンプルの幾何学的座標を平均することによって計算される);
−そのような平均色を現在の3Dサンプルに割り当てること;および
オリジナルの3Dサンプルとの誤差が最小限に抑えられるように、現在の3Dサンプルの色を修正すること(色成分あたり±2差以内)。
【0203】
図7(符号化)および
図7b(復号化)の方法は、異なる使用例で使用され得る。
【0204】
第1の使用例では、単一の幾何形状画像(層)を使用して、点群フレームPCFの幾何形状を符号化することができる。例えば、当該単一の幾何形状画像は、最も低い深度を有する2Dサンプルに関連付けられた深度値D0を格納することができる。次に、少なくとも1つのスタッフィング3Dサンプルが、
図7または
図7bの方法に従って追加され得る。最後に、点群PCFの3Dサンプルに関連付けられた色情報は、第1のテクスチャ画像TI0として符号化され得、明示的な色分けモードが当該少なくとも1つのスタッフィング3Dサンプルに割り当てられたときに、少なくとも1つのスタッフィングサンプルに関連付けられた色情報は、第2のテクスチャ画像TI1として符号化される。
【0205】
第2の使用例では、2つの幾何形状画像GI0およびGI1(2つの層)を使用して、点群フレームPCFの幾何形状を符号化することができる。例えば、第1の幾何形状画像は、最も低い深度(第1の層)を有する2Dサンプルに関連付けられた深度値D0を格納することができ、第2の幾何形状画像GI1は、最も高い深度(第2の層)を有する2Dサンプルに関連付けられた深度値D1を格納することができる。次に、少なくとも1つのスタッフィング3Dサンプルが、
図7または
図7bの方法に従って追加され得る。最後に、点群PCFの3Dサンプルに関連付けられた色情報は、2つのテクスチャ画像TI0およびTI1として符号化され得る。第1のテクスチャ画像TI1は、第1の幾何形状画像GI0に対して色情報を符号化し、第2のテクスチャ画像TI1は、第2の幾何形状画像GI1に対して色情報を符号化する。第3のテクスチャ画像TI2は、明示的な色分けモードが当該少なくとも1つのスタッフィング3Dサンプルに割り当てられるときに、少なくとも1つのスタッフィングサンプルに関連付けられた色情報を符号化することができる。
【0206】
図1〜
図12において、様々な方法が、本明細書に記載されており、その方法の各々は、記載された方法を達成するための1つ以上のステップまたは動作を含む。ステップまたは動作の特定の順番が、その方法の適切な動作のために必要とされない限り、特定のステップおよび/または動作の順番および/または使用は、変更するか、または組み合わせることができる。
【0207】
いくつかの例が、ブロック図および動作フローチャートに関連して説明されている。各ブロックは、特定の論理関数(複数可)を実施するための1つ以上の実行可能命令を含む、回路要素、モジュール、またはコードの一部を表す。また、他の実施態様では、ブロック内に記述された機能(複数可)は、示された順番から外れて行われてもよいことに留意されたい。例えば、連続的に示される2つのブロックは、実際には、実質的に同時に実行されてもよく、またはそれらのブロックは、場合によっては、必然的に伴う機能性に応じて、逆の順番で実行されてもよい。
【0208】
本明細書に記載された実施態様および態様は、例えば、方法もしくはプロセス、装置、コンピュータプログラム、データストリーム、ビットストリーム、または信号で実施され得る。単一の形式の実施態様の文脈でのみ考察されている(例えば、方法としてのみ考察されている)場合であっても、考察された特徴の実施態様はまた、他の形式(例えば、装置またはコンピュータプログラム)でも実施され得る。
【0209】
方法は、例えば、プロセッサ内で実施され得、そのプロセッサは、一般に処理デバイスを指し、例えば、コンピュータ、マイクロプロセッサ、集積回路、またはプログラマブルロジックデバイスを含む。プロセッサはまた、通信デバイスも含む。
【0210】
さらに、方法は、プロセッサにより実行される命令によって実施され得、係る命令(および/または実施態様により生成されるデータ値)は、コンピュータ可読記憶媒体に格納され得る。コンピュータ可読記憶媒体は、コンピュータ可読プログラム製品の形式を取ることができ、このコンピュータ可読プログラム製品は、1つ以上のコンピュータ可読媒体(複数可)内で具現化され、コンピュータにより実行可能である、その媒体上で具現化されるコンピュータ可読プログラムコードを有する。本明細書で使用されるようなコンピュータ可読記憶媒体は、内部に情報を格納するための固有の能力、ならびに内部から情報を取得するための固有の能力が与えられた非一時的記憶媒体とみなされ得る。コンピュータ可読記憶媒体は、例えば、電子、磁気、光学、電磁、赤外線、もしくは半導体のシステム、装置、もしくはデバイス、または前述の任意の好適な組み合わせとすることができるが、これらに限定されない。本実施形態が適用され得るコンピュータ可読記憶媒体のより具体的な例を提供するが、当業者によって容易に理解されるように、以下のものは、単に例示的であり、かつ非網羅的なリストであることを理解されたい。すなわち、ポータブルコンピュータディスケット、ハードディスク、読み出し専用メモリ(ROM)、消去可能型プログラマブル読み出し専用メモリ(EPROMまたはフラッシュメモリ)、ポータブルコンパクトディスク読み出し専用メモリ(CD−ROM)、光学記憶デバイス、磁気記憶デバイス、または前述の任意の好適な組み合わせ、である。
【0211】
命令は、プロセッサ可読媒体上で有形的に具現化されるアプリケーションプログラムを形成し得る。
【0212】
命令は、例えば、ハードウェア、ファームウェア、ソフトウェア、または組み合わせであり得る。命令は、例えば、オペレーティングシステム、別個のアプリケーション、またはこの2つの組み合わせに見出すことができる。したがって、プロセッサは、例えば、プロセスを実行するように構成されたデバイスと、プロセスを実行するための命令を有するプロセッサ可読媒体(記憶デバイスなど)を含むデバイスとの両方として特徴付けられ得る。さらに、プロセッサ可読媒体は、命令に加えてまたは命令の代わりに、実施態様によって生成されたデータ値を格納し得る。
【0213】
装置は、例えば、適切なハードウェア、ソフトウェア、およびファームウェアで実施され得る。係る装置の例には、パーソナルコンピュータ、ラップトップ、スマートフォン、タブレットコンピュータ、デジタルマルチメディアセットトップボックス、デジタルテレビジョン受信機、パーソナルビデオレコーディングシステム、接続された家庭電化製品、ヘッドマウントディスプレイデバイス(HMD、シースルーグラス)、プロジェクタ(ビーマー)、「没入型バーチャルリアリティー体験デバイス(caves)」(複数のディスプレイを含むシステム)、サーバ、ビデオエンコーダ、ビデオデコーダ、ビデオデコーダから出力されるポストプロセッサ処理、ビデオエンコーダへの入力を提供するプリプロセッサ、ウェブサーバ、セットトップボックス、および点群、ビデオ、もしくは画像を処理するための任意の他のデバイス、または他の通信デバイスが含まれる。明らかなように、機器は移動型であり、移動車両に設置されている場合さえある。
【0214】
コンピュータソフトウェアは、プロセッサ6010によって、もしくはハードウェアによって、またはハードウェアおよびソフトウェアの組み合わせによって実装されてもよい。非制限的な例として、それらの実施形態はまた、1つ以上の集積回路によっても実施され得る。メモリ6020は、技術的な環境に適する任意のタイプのものであってもよく、非限定的な例として、光メモリデバイス、磁気メモリデバイス、半導体ベースのメモリデバイス、固定メモリ、および取り外し可能なメモリなどの任意の適切なデータ記憶技術を使用して実装されてもよい。プロセッサ6010は、技術的な環境に適する任意のタイプのものであってもよく、非限定的な例として、マイクロプロセッサ、汎用コンピュータ、専用コンピュータ、およびマルチコアアーキテクチャに基づくプロセッサのうちの1つ以上を包含し得る。
【0215】
当業者にとっては明らかであるように、実施態様は、例えば、格納または送信され得る情報を搬送するためにフォーマット化された様々な信号を生成し得る。情報は、例えば、方法を実行するための命令、または説明された実施態様のうちの1つによって生成されたデータを含み得る。例えば、信号は、記載された実施形態のビットストリームを搬送するためにフォーマット化され得る。そのような信号は、例えば、電磁波として(例えば、スペクトルの無線周波数部分を使用して)、またはベースバンド信号としてフォーマット化され得る。フォーマット化は、例えば、データストリームを符号化すること、および符号化されたデータストリームで搬送波を変調することを含み得る。信号が搬送する情報は、例えば、アナログ情報またはデジタル情報であり得る。信号は、既知のように、さまざまな異なる有線または無線リンクを介して送信され得る。信号は、プロセッサ可読媒体に格納され得る。
【0216】
本明細書で使用される専門用語は、特定の実施形態を説明することのみを目的としており、限定することは意図されていない。本明細書で使用されるとき、単数形「a」、「an」、および「the」は、その文脈が特段明確に示していない限り、複数形をも含むことが意図され得る。「含む/備える」および/または「含んでいる/備えている」という用語は、本明細書で使用されるとき、記述された、例えば、特徴、整数、ステップ、動作、要素、および/またはコンポーネントの存在を指定し得るが、1つ以上の他の特徴、整数、ステップ、動作、要素、コンポーネント、および/またはそれらのグループの存在または追加を排除しないことは、さらに理解されるであろう。さらに、ある要素が、別の要素に対して「応答する」または「接続される」と称されるとき、その要素は、他の要素に対して直接応答するか、もしくは直接接続され得るか、または介在する要素が存在し得る。対照的に、ある要素が、他の要素に「直接応答する」または「直接接続される」と称されるとき、介在する要素は、存在しない。
【0217】
記号/用語である「/」、「および/または」、および「のうちの少なくとも1つ」のいずれかの使用は、例えば、「A/B」、「Aおよび/またはB」、および「AとBのうちの少なくとも1つ」の場合、第1の列挙選択肢(A)のみの選択、または第2の列挙選択肢(B)のみの選択、または両方の選択肢(AおよびB)の選択を包含することが意図され得ることを理解されたい。さらなる例として、「A、B、および/またはC」と「A、B、およびCのうちの少なくとも1つ」の場合、そのような語法は、第1の列挙選択肢(A)のみの選択、または第2の列挙選択肢(B)のみの選択、または第3の列挙選択肢(C)のみの選択、または第1および第2の列挙選択肢(AおよびB)のみの選択、または第1および第3の列挙選択肢(AおよびC)のみの選択、または第2および第3の列挙選択肢(BおよびC)のみの選択、または3つすべての選択肢(AおよびBおよびC)の選択を包含することが意図されている。これは、本技術分野および関連技術分野の当業者には明らかなように、列挙されている項目と同じだけ拡張することができる。
【0218】
様々な数値、例えば、minDepthまたは表面厚さが、本出願で使用され得る。特定の値は、例えば、目的であってもよく、記載される態様は、これらの特定の値に限定されない。
【0219】
第1、第2などの用語が、各種の要素を説明するために、本明細書で使用される場合があるが、これらの要素は、これらの用語によっては限定されないことが、理解されるであろう。これらの用語は、ある要素と別の要素を区別するためにのみ使用される。例えば、本出願の教示から逸脱することなく、第1の要素は、第2の要素と称され得、同様に、第2の要素は、第1の要素と称され得る。第1の要素と第2の要素との間の順序付けには、意味がない。
【0220】
「1つの実施形態では」または「ある実施形態では」または「1つの実施態様では」または「ある実施態様では」、ならびにそれらの他のバリエーションへの言及を頻繁に使用して、特定の特徴、構造、特性など(実施形態/実施態様と関連して説明される)が、少なくとも1つの実施形態/実施態様に含まれることを伝えている。したがって、「1つの実施形態では」または「ある実施形態では」または「1つの実施態様では」または「ある実施態様では」、ならびに任意の他のバリエーショという成句の出現は、本出願全体を通じて様々な場所で現れ、必ずしもすべて同じ実施形態を指しているわけではない。
【0221】
同様に、本明細書内の「実施形態/例/実施態様に従って」または「実施形態/例/実施態様では」、ならびにそれらの他のバリエーションへの言及を頻繁に使用して、特定の特徴、構造、または特性(実施形態/例/実施態様と関連して説明される)が、少なくとも1つの実施形態/例/実施態様に含まれ得ることを伝えている。したがって、本明細書の様々な場所での「実施形態/例/実施態様に従って」または「実施形態/例/実施態様では」という表現の出現は、必ずしもすべて同じ実施形態/例/実施態様を指すものではなく、別個または代替の実施形態/例/実施態様が、必ずしも他の実施形態/例/実施態様を相互に除外するものでもない。
【0222】
特許請求の範囲に現れる参照数字は、例示のみを目的としており、特許請求の範囲を限定する影響を及ぼさないものとする。明示的には説明されていないが、本実施形態/例および変形例は、任意の組み合わせまたは部分的組み合わせで使用することができる。
【0223】
図がフロー図として提示されているとき、それはまた、対応する装置のブロック図も提供していることを理解されたい。同様に、図がブロック図として提示されている場合、それはまた、対応する方法/プロセスのフロー図も提供していることを理解されたい。
【0224】
いくつかの図には、通信の主要な方向を示すために通信経路上に矢印が含まれるが、通信は、図示された矢印と反対側の方向に生じる場合があることを理解されたい。
【0225】
様々な実施態様が、復号化を伴う。「復号化」は、本出願で使用されるとき、例えば、受信した点群フレーム上で実行されるプロセスのすべてまたは一部を包含して、表示のために好適である最終的な出力を生成することができる。様々な実施形態では、そのようなプロセスは、一般的に、画像ベースのデコーダにより実行されるプロセスのうちの1つ以上を含む。
【0226】
さらなる例として、一実施形態では、「復号化」は、エントロピー復号化のみを指し得、別の実施形態では、「復号化」は、差動復号化のみを指し得、別の実施形態では、「復号化」は、エントロピー復号化および差動復号化の組み合わせを指し得る。「復号化プロセス」という成句が、具体的に動作のサブセットを指すことが意図され得るのか、または概してより広い復号化プロセスを指すことが意図され得るのかどうかについては、具体的な説明の文脈に基づいて明確となり得、当業者によって十分理解されるものと思われる。
【0227】
様々な実施態様が、符号化を伴う。「復号化」に関する上述の考察と同様に、本出願で使用されるとき、「符号化」は、符号化されたビットストリームを生成するために、例えば、入力点群フレーム上で実行されるプロセスのすべてまたは一部を包含し得る。様々な実施形態では、そのようなプロセスは、一般的に、画像ベースのデコーダにより実行されるプロセスのうちの1つ以上を含む。
【0228】
さらなる例として、一実施形態では、「符号化」はエントロピー符号化のみを指してもよく、別の実施形態では、「符号化」は差動符号化のみを指してもよく、別の実施形態では、「符号化」は差動符号化とエントロピー符号化の組み合わせを指してもよい。「符号化プロセス」という成句が、具体的に動作のサブセットを指すことが意図され得るのか、または概してより広い符号化プロセスを指すことが意図され得るのかどうかについては、具体的な説明の文脈に基づいて明確となり得、当業者によって十分理解されるものと思われる。
【0229】
加えて、本出願は、様々な断片情報を「判定する」ことに言及し得る。情報を判定することは、例えば、情報を推定すること、情報を計算すること、情報を予測すること、またはメモリから情報を取得することのうちの1つ以上を含み得る。
【0230】
さらに、本出願は、様々な断片情報に「アクセスする」ことに言及し得る。情報にアクセスすることは、例えば、情報を受信すること、情報を取得すること(例えば、メモリから)、情報を格納すること、情報を移動させること、情報を複製すること、情報を計算すること、情報を判定すること、情報を予測すること、または情報を推定することのうちの1つ以上を含み得る。
【0231】
加えて、「スタッフィング3Dサンプルを追加すること」という用語は、点群フレーム内に3Dサンプルを含めることを意味する。例えば、点群の3Dサンプルがテーブル、配列、の要素として格納されるとき、スタッフィング3Dサンプルを追加することは、当該スタッフィング3Dサンプルを定義する情報を当該テーブル(配列)の新しい要素に格納することを意味する。
【0232】
加えて、「スタッフィング」という用語は、本実施形態のうちの少なくとも1つに従って、3Dサンプルが作製されることを示す。
【0233】
加えて、3Dサンプルに情報(例えば、色情報または色分けモード)を「割り当てる」という用語は、当該情報を当該3Dサンプルに関連付けること、すなわち、例えば、テーブル(配列)または任意の他の手段で関連付けることを意味する。
【0234】
加えて、本出願は、様々な断片情報を「受信すること」に言及し得る。受信することとは、「アクセスすること」と同様に、広義の用語であることを意図されている。情報を受信することは、例えば、情報にアクセスすること、または(例えば、メモリから)情報を取得することのうちの1つ以上を含み得る。さらに、「受信すること」は、典型的には、例えば、情報を格納する、情報を処理する、情報を送信する、情報を移動させる、情報をコピーする、情報を消去する、情報を計算する、情報を判定する、情報を予測する、または情報を推定するなどの動作中に、何らかの方法で関与する。
【0235】
また、本明細書で使用されるとき、「信号」という単語は、とりわけ、対応するデコーダに対して何かを示すことを指す。例えば、ある特定の実施形態において、エンコーダは、特定の色分けモードを当該少なくとも1つのスタッフィング3Dサンプルに信号伝達し、当該色分けモードは、当該少なくとも1つのスタッフィング3Dサンプルに割り当てられた色情報がビットストリームで明示的に符号化されているかどうか、または当該色情報が暗黙的であるかどうかを示し、色情報は補間される。このように、実施形態では、同じパラメータが、エンコーダ側およびデコーダ側の両方で使用され得る。したがって、例えば、エンコーダは、特定のパラメータをデコーダに送信し(明示的な信号伝達)、その結果、デコーダは、同じ特定のパラメータを使用することができる。逆に、デコーダが既に特定のパラメータ、ならびに他のパラメータを有する場合、信号伝達は、送信せずに使用されて(暗黙的な信号伝達)、単にデコーダが特定のパラメータを知り、そして選択することを可能にし得る。任意の実際の機能の送信を回避することによって、様々な実施形態においてビット節減が実現される。信号伝達は、様々な方法で達成され得ることを理解されたい。例えば、様々な実施形態では、1つ以上のシンタックス要素、フラグなどを使用して、対応するデコーダに情報を信号伝達する。前述は、単語「信号」の動詞形態に関するものであるが、単語「信号」は、本明細書でも名詞として使用され得る。
【0236】
多数の実施態様が説明されてきた。それでもなお、さまざまな変更が行われ得ることが理解されよう。例えば、異なる実施態様の要素は、他の実施態様を生成するために、組み合わされ、補足され、変更され、または削除されてもよい。さらに、当業者は、他の構造およびプロセスが開示されたものの代わりになり得、結果として生じる実施態様が、少なくとも実質的に同じ機能(複数可)を、少なくとも実質的に同じ方法(複数可)で実行して、開示された実施態様と少なくとも実質的に同じ結果(複数可)を達成することを理解するであろう。したがって、これらおよび他の実施態様は、本出願によって企図されている。