(19)【発行国】日本国特許庁(JP)
(12)【公報種別】特許公報(B2)
(11)【特許番号】
(24)【登録日】2024-02-16
(45)【発行日】2024-02-27
(54)【発明の名称】点群のジオメトリを符号化/復号する方法及び装置
(51)【国際特許分類】
G06T 19/20 20110101AFI20240219BHJP
H04N 19/597 20140101ALI20240219BHJP
G06T 17/10 20060101ALI20240219BHJP
【FI】
G06T19/20
H04N19/597
G06T17/10
(21)【出願番号】P 2020572520
(86)(22)【出願日】2019-06-28
(86)【国際出願番号】 US2019039784
(87)【国際公開番号】W WO2020014011
(87)【国際公開日】2020-01-16
【審査請求日】2022-05-31
(32)【優先日】2018-07-11
(33)【優先権主張国・地域又は機関】EP
(32)【優先日】2019-01-17
(33)【優先権主張国・地域又は機関】EP
(73)【特許権者】
【識別番号】518338149
【氏名又は名称】インターデジタル ヴイシー ホールディングス, インコーポレイテッド
(74)【代理人】
【識別番号】100079108
【氏名又は名称】稲葉 良幸
(74)【代理人】
【識別番号】100109346
【氏名又は名称】大貫 敏史
(74)【代理人】
【識別番号】100117189
【氏名又は名称】江口 昭彦
(74)【代理人】
【識別番号】100134120
【氏名又は名称】内藤 和彦
(74)【代理人】
【識別番号】100108213
【氏名又は名称】阿部 豊隆
(72)【発明者】
【氏名】グーデ,セリーヌ
(72)【発明者】
【氏名】リカード,ジュリアン
(72)【発明者】
【氏名】シュヴェ,ジャン-クロード
(72)【発明者】
【氏名】ジャンドロン,デイビッド
(72)【発明者】
【氏名】オリビエ,ヤニック
(72)【発明者】
【氏名】ラック,ジョアン
【審査官】鈴木 圭一郎
(56)【参考文献】
【文献】国際公開第2018/123801(WO,A1)
【文献】特開2002-199393(JP,A)
(58)【調査した分野】(Int.Cl.,DB名)
G06T 19/20
H04N 19/597
G06T 17/10
(57)【特許請求の範囲】
【請求項1】
方法であって、
-ビットストリームに符号化された点群の少なくとも1つの再構築された点を取得すること、
-前記ビットストリームから少なくとも1つの補間符号化モードを取得すること
であって、前記補間符号化モードは、少なくとも1つの再構築された点周辺の近傍と最小奥行き値とを定義する、取得すること、
-前記補間符号化モードに従い前記少なくとも1つの再構築された点に対して少なくとも1つの補間点を生成し、
前記最小奥行き値、及び前記少なくとも1つの再構築された点の復号された奥行きと前記近傍内の少なくとも1つの点の奥行きとの間で決定された最大奥行き差に従い前記少なくとも1つの補間点の各々に奥行き値を関連付けること、
を含み、
前記少なくとも1つの補間符号化モードは、前記点群のパッチ又はブロック毎に前記ビットストリームにシグナリングされる、方法。
【請求項2】
装置であって、
-ビットストリームに符号化された点群の少なくとも1つの再構築された点を取得し、
-前記ビットストリームから
、少なくとも1つの再構築された点周辺の近傍と最小奥行き値とを定義する少なくとも1つの補間符号化モードを取得して、
-前記補間符号化モードに従い前記少なくとも1つの再構築された点に対して少なくとも1つの補間点を生成し、
前記最小奥行き値、及び前記少なくとも1つの再構築された点の復号された奥行きと前記近傍内の少なくとも1つの点の奥行きとの間で決定された最大奥行き差に従い前記少なくとも1つの補間点の各々に奥行き値を関連付けるように、
構成された1つ以上のプロセッサを含
み、
前記少なくとも1つの補間符号化モードは、前記点群のパッチ又はブロック毎に前記ビットストリームにシグナリングされる、装置。
【請求項3】
前記少なくとも1つの再構築された点を取得することが、
-前記ビットストリームから奥行き画像を復号して、前記少なくとも1つの再構築された点が前記復号された奥行き画像の少なくとも1つのピクセルに対応するようにすることを含む、請求項1に記載の方法。
【請求項4】
少なくとも1つの補間点を生成することが、前記復号された奥行き画像の前記少なくとも1つのピクセルの近傍に基づいていて、前記近傍が前記少なくとも1つの再構築された点周辺の画像領域であり、前記近傍が前記補間符号化モードにより定義される、請求項3に記載の方法。
【請求項5】
前記少なくとも1つの補間点に関連付けられた前記奥行き値が、前記少なくとも1つ再構築された点の奥行き値から最大奥行き値までの範囲にある、請求項1若しくは3~
4のいずれか1項に記載の方法。
【請求項6】
前記最大奥行き差又は前記最大奥行き値が前記補間符号化モードにより定義される、請求項
5に記載の方法。
【請求項7】
前記少なくとも1つの再構築された点を取得することが、
-前記ビットストリームから奥行き画像を復号して、前記少なくとも1つの再構築された点が前記復号された奥行き画像の少なくとも1つのピクセルに対応するようにすることを含む、請求項2に記載の装置。
【請求項8】
少なくとも1つの補間点を生成することが、前記復号された奥行き画像の前記少なくとも1つのピクセルの近傍に基づいていて、前記近傍が前記少なくとも1つの再構築された点周辺の画像領域であり、前記近傍が前記補間符号化モードにより定義される、請求項
7に記載の装置。
【請求項9】
前記最大奥行き差又は前記最大奥行き値が前記補間符号化モードにより定義される、請求項
2に記載の装置。
【請求項10】
方法であって、
-点群の1つの3D点を投影面上に投影することにより第1の2D点を取得すること、
-前記第1の2D点に従い
、前記第1の2D点周辺の近傍に属する少なくとも1つの他の2D点を取得すること、
-前記少なくとも1つの他の2D点を近似すべく、前記第1の2D点の補間符号化モードを、前記第1の2D点から、及び前記補間符号化モードにより定義された少なくとも1つの2D補間点から取得された1つの再構築された2D点に基づいて決定及び符号化すること
であって、
前記補間符号化モードは、前記少なくとも1つの再構築された2D点周辺の近傍と最小奥行き値とを定義し、前記最小奥行き値、及び前記少なくとも1つの再構築された2D点の復号された奥行きと、前記近傍内の少なくとも1つの点の奥行きとの間で決定された最大奥行き差に従い前記少なくとも1つの2D補間点の各々に奥行き値を関連付け、前記少なくとも1つの補間符号化モードは、前記点群のパッチ又はブロック毎にビットストリームにシグナリングされる、符号化することを含む方法。
【請求項11】
装置であって、
-点群の1つの3D点を投影面上へ投影することにより第1の2D点を取得し、
-前記第1の2D点に従い
、前記第1の2D点周辺の近傍に属する少なくとも1つの他の2D点を取得して、
-前記少なくとも1つの他の2D点を近似すべく、前記第1の2D点の補間符号化モードを、前記第1の2D点から、及び前記補間符号化モードにより定義された少なくとも1つの2D補間点から取得された1つの再構築された2D点に基づいて決定及び符号化
し、
前記補間符号化モードは、前記少なくとも1つの再構築された2D点周辺の近傍と最小奥行き値とを定義し、前記最小奥行き値、及び前記少なくとも1つの再構築された2D点の復号された奥行きと、前記近傍内の少なくとも1つの点の奥行きとの間で決定された最大奥行き差に従い前記少なくとも1つの2D補間点の各々に奥行き値を関連付け、前記少なくとも1つの補間符号化モードは、前記点群のパッチ又はブロック毎にビットストリームにシグナリングされて、符号化するように、
構成された少なくとも1つのプロセッサを含む装置。
【請求項12】
前記方法が更に、前記第1の2D点の奥行き値を第1の奥行き画像のピクセル値に割り当てること、前記第1の奥行き画像を符号化することにより符号化された第1の奥行き画像を取得すること、及び前記符号化された第1の奥行き画像を復号することにより復号された第1の奥行き画像を取得することを含み、前記再構築された2D点が前記復号された第1の奥行き画像の1つのピクセルである、請求項
10に記載の方法。
【請求項13】
前記補間符号化モードを決定することが、候補補間符号化モードに従い定義された少なくとも1つの2D補間点により、前記少なくとも1つの他の2D点の特定の符号化を示す少なくとも1つの候補補間符号化モードに関連付けられたレート歪みコストに基づいている、請求項
10又は12に記載の方法。
【請求項14】
前記少なくとも1つのプロセッサが更に、前記第1の2D点の奥行き値を第1の奥行き画像のピクセル値に割り当てること、前記第1の奥行き画像を符号化することにより符号化された第1の奥行き画像を取得すること、及び前記符号化された第1の奥行き画像を復号することにより復号された第1の奥行き画像を取得することを含み、前記再構築された2D点が前記復号された第1の奥行き画像の1つのピクセルである、請求項
11に記載の装置。
【請求項15】
前記補間符号化モードを決定することが、候補補間符号化モードに従い定義された少なくとも1つの2D補間点により、前記少なくとも1つの他の2D点の特定の符号化を示す少なくとも1つの候補補間符号化モードに関連付けられたレート歪みコストに基づいている、請求項
11又は14に記載の装置。
【請求項16】
コンピュータプログラムであって、プログラムが、1つ以上のプロセッサにより実行された場合、前記1つ以上のプロセッサに、請求項1、3~
6のいずれか1項に記載の方法を実行させる、命令を含むコンピュータプログラム。
【請求項17】
非一時的コンピュータ可読媒体であって、1つ以上のプロセッサに、請求項1、3~
6のいずれか1項に記載の方法を実行させる、命令を含む非一時的コンピュータ可読媒体。
【請求項18】
コンピュータプログラムであって、プログラムが、1つ以上のプロセッサにより実行された場合、前記1つ以上のプロセッサに、請求項
10、
12~
13のいずれか1項に記載の方法を実行させる、命令を含むコンピュータプログラム。
【請求項19】
非一時的コンピュータ可読媒体であって、1つ以上のプロセッサに、請求項
10、
12~
13のいずれか1項に記載の方法を実行させる、命令を含む非一時的コンピュータ可読媒体。
【発明の詳細な説明】
【技術分野】
【0001】
分野
本実施形態は一般に、3D物体の外面を表す点群の符号化及び復号に関する。特に、但し非限定的に、本実施形態の技術分野はそのような点群のジオメトリの符号化/復号に関係している。
【背景技術】
【0002】
背景
本節は、以下に記述及び/又は権利請求する本実施形態の各種態様に関連し得る技術分野の各種態様を読者に紹介することを意図している。以下の記述は、本実施形態の各種態様に対する理解を深めるべく読者に背景情報を提供するのに役立つものと思われる。従って、以下の記述は従来技術の紹介ではなく上述の主旨で読まれるべきものであることを理解されたい。
【0003】
点群は、何らかの座標系におけるデータ点の組である。3次元座標系(3D空間)において、これらの点は通常、3D物体の外面を表すことを意図されている。点群の各点は多くの場合、場所(3D空間内のX、Y及びZ座標)、及び恐らくは他の付随する属性、例えばRGB又はYUV色空間内で表される色、透明度、反射率、2成分法線ベクトル等により定義される。
【0004】
点群を6成分点(X、Y、Z、R、G、B)又は等価的に(X、Y、Z、Y、U、V)の組として表すことが通常であり、(X,Y,Z)は3D空間内の着色点の座標を定義し、(R,G,B)又は(Y,U,V)は当該着色点の色を定義する。
【0005】
点群は、当該点群が経時的に変化するか否かに応じて静的又は動的であってよい。動的点群の場合、点の個数は一定でなく、逆に一般に経時的に変化することに注意されたい。動的点群は従って、点の組の時系列的リストである。
【0006】
実際には、点群は、像又は建物等の物体を搬送するか又は現地を訪問することなく当該物体の空間構成を共有すべく3D走査する文化遺産/建物等、各種の目的に利用できる。また、例えば地震による寺院の破壊等、物体が破壊され得る場合に備えて当該物体に関する知識を確実に保存する仕方である。このような点群は典型的には静的であって、着色され且つ巨大である。
【0007】
別のユースケースは、3D表現を用いることで地図が平面に限定されずレリーフを含んでいてよい地形学及び地図学である。ここでGoogle Mapsは3Dマップの良い例であるが、点群ではなくメッシュを用いる。しかしながら、点群は3Dマップの適切なデータ形式であり得、そのような点群は典型的に静的であって、着色され且つ巨大である。
【0008】
自動車産業及び自動運転車もまた、点群を利用できる領域である。自動運転車は、直近傍の現状に基づいて良好な運転意思決定を行うべく自身の環境を「探索」できなければならない。LIDAR等の典型的センサは、決定エンジンが用いる動的点群を生成する。これらの点群は人間による目視を意図されておらず、典型的には小さくて必ずしも着色されておらず、撮像頻度が高く動的である。当該点群はLidarが与える反射率等、他の属性を有していてよく、当該属性は検知物体の材料に関する良好な情報であって決定に役立つ場合がある。
【0009】
仮想現実及び没入世界は近年盛んに話題になっており、多くの人が2Dフラットビデオの将来として予見している。基本概念としては、目前の仮想世界しか見ることができない標準TVとは逆に、見る人を自身の周囲全体の環境に没入させることである。環境における見る人の自由度に応じて没入度にいくつかの階調がある。着色点群は、仮想現実(又はVR)世界を配信する良好な形式の候補である。これらは静的又は動的であってよく、典型的には平均的な大きさを有し、例えば一度に数百万点を超えることはない。
【0010】
点群圧縮が没入世界における3D物体の保存/送信に成功するのは、ビットストリームの大きさがエンドユーザーに実用的な記憶容量/送信速度を与えるのに充分小さい場合だけである。
【0011】
受容可能な(又は好適には極めて良好な)体感品質を維持しながら合理的なビットレート消費でエンドユーザーに動的点群を配信できることが必須である。これらの動的点群を効率的に圧縮することが没入世界の配信チェーンを実用化するためのキーポイントである。
【0012】
画像に基づく点群圧縮技術が、圧縮効率と複雑度の低さの組み合わせに起因して急速に普及が進んでいる。これらは、二つの主要なステップで進行する。最初に、点群、すなわち3D点を2D画像に投影(正射投影)する。例えば、少なくとも1つの奥行き画像が、点群のジオメトリ、すなわち3D空間内の3D点の空間座標を表し、少なくとも1つのテクスチャ画像が点群の3D点に付随する属性、例えば当該3D点に関連するテクスチャ/色情報を表す。次に、これらの技術は従来のビデオエンコーダによりこのような奥行き及びテクスチャ画像を符号化する。
【0013】
画像に基づく点群圧縮技術は、2Dビデオエンコーダ、例えばHEVC(“ITU-T H.265 Telecommunication standardization sector of ITU (10/2014), series H: audiovisual and multimedia systems, infrastructure of audiovisual services - coding of moving video, High efficiency video coding, Recommendation ITU-T H.265”)の性能を利用することにより良好な圧縮性能を実現すると同時に、簡単な投影スキームを用いることにより複雑さを低く抑えている。
【0014】
画像に基づく点群圧縮技術の課題の一つは、点群が、特に点の分布が折り目の多い表面(布地等の凹/凸領域)に沿う場合、又は点の分布が全く表面に沿わない(毛皮又は毛髪等)場合に画像への投影に適し得ないことである。これらの状況において、画像に基づく点群圧縮技術の圧縮効率が低くなる(多くの細かい投影が必要とされ、2Dビデオ圧縮の効率が下がる)か、又は(点群を表面に投影する困難さに起因して)品質が低下する。
【0015】
上述の課題を軽減すべく先端技術で用いられるアプローチの一つは、複数のジオメトリ及びテクスチャ情報を画像内の同一空間位置(ピクセル)に投影するものである。これは、いくつかの奥行き及び/又はテクスチャ画像が点群の3D点毎に生成され得ることを意味する。
【0016】
これは例えば、点群が正射投影面に正射投影される、ISO/IEC JTC1/SC29/WG11/N17248, Macau, China, October 2017に定義されたいわゆるテストモデルカテゴリ2点群エンコーダ(TMC2)のケースである。次いで前記投影面の座標毎に2個の奥行き値が関連付けられており、1つが最近点に関連付けられた奥行き値(最小奥行き値)を表し、他の1つが最遠点の奥行き値(最大奥行き値)を表している。次いで第1の奥行き画像が最小奥行き値(D0)から生成され、第2の奥行き画像が最大奥行き値(D1)の絶対値及から生成され、D1-D0は最大表面の厚さ以下である。
【0017】
次いで奥行き画像及び付随するメタデータが符号化及び復号される。次いで点群のジオメトリが2個の復号された奥行き画像から再構築される。しかし、点群の大域的符号化コストを減らすには前記2個の奥行き画像の符号化効率を高める必要がある。
【発明の概要】
【0018】
概要
以下に、本実施形態のいくつかの態様の基本的理解が得られるよう本実施形態の簡略な概要を示す。本概要は本実施形態の網羅的に俯瞰するものではない。本概要は本実施形態の主要又は必須要素の識別を意図していない。以下の概要は単に本実施形態のいくつかの態様を、以下に示すより詳細な記述の導入部として簡略化された形式で示すものに過ぎない。
【0019】
本実施形態は、従来技術の短所の少なくとも一つを、
-1つの点群の少なくとも1つの点から少なくとも1つの第1の点を、当該点群の前記点を投影面上に投影して、前記少なくとも1つの第1の点に従い決定された当該点群の少なくとも1つの他の点を取得することにより取得すること、
-当該点群の前記少なくとも1つの他の点を近似すべく、前記少なくとも1つの第1の点の少なくとも1つの補間符号化モードを、前記少なくとも1つの第1の点から取得された少なくとも1つの再構築された点、及び前記少なくとも1つの補間符号化モードにより定義された少なくとも1つの補間点に基づいて決定及び符号化すること、及び
-前記少なくとも補間符号化モードを画像データの値としてシグナリングすることを含む方法により克服すべく提供するものである。
【0020】
本実施形態の特定の性質、並びに本実施形態の他の目的、利点、特徴及びを使用は、添付の図面と合わせて以下の例の記述から明らかになろう。
【0021】
図面の簡単な説明
添付の図面に本実施形態の複数の例を示す。
【図面の簡単な説明】
【0022】
【
図1】本実施形態の一例による、点群の複数の点の奥行き値を符号化する方法100のステップを模式的に示す。
【
図2】本実施形態の一実施形態による、ステップ130の一実施形態を模式的に示す。
【
図3】本実施形態の一例による、候補補間符号化モードの複数の実施形態を示す。
【
図3a】本実施形態の一例による、候補補間符号化モードの複数の実施形態を示す。
【
図4】本実施形態の一例による、第1の奥行き画像及び第2の奥行き画像をビットストリームから復号する方法200のステップを模式的に示す。
【
図5】従来技術(TMC2)で定義された点群のジオメトリ及びテクスチャを符号化する方法を模式的に示す。
【
図6】
図5の符号化方法における方法100及び200の一使用例を模式的に示す。
【
図7】従来技術(TMC2)で定義された点群のジオメトリ及びテクスチャを復号する方法を模式的に示す。
【
図8】
図7の復号方法における方法200の一使用例を模式的に示す。
【
図9】本実施形態の一例による、各種態様及び実施形態が実装されたシステムの一例のブロック図を示す。
【
図10】本実施形態の一例による、通信ネットワークを介して通信する2個のリモート機器を示す。
【
図11】本実施形態の一例による、信号の構文を示す。
【
図12】TMC2における再構築モードの使用の分布の例を示す。
【0023】
類似又は同一要素には同一参照番号が付与されている。
【発明を実施するための形態】
【0024】
本実施形態の例の説明
本実施形態について、本実施形態の複数の例を示す添付図面を参照しながら以下により完全に記述する。しかし、本実施形態は多くの代替形式で実現可能であり、以下に記述する例に限定されるものと解釈すべきでない。従って、本実施形態は各種の変更及び代替形式をとり得るが、それらの特定の例を図面に例示して本明細書で詳述する。しかし、開示する特定の形式に本実施形態を限定する意図は無く、逆に本明細書は請求項に記載する本実施形態の概念及び範囲に含まれる全ての変更、等価、及び代替を対象とすることを理解されたい。
【0025】
本明細書で用いる用語は、特定の例の記述のみを目的としており、本実施形態を限定することは意図していない。本明細書で用いるように、単数形「a」、「an」、及び「the」は、別途文脈から明示されない限り複数形も含むことを意図している。更に、用語「含む」、「含んでいる」、「包含する」及び/又は「包含している」は、本明細書で用いられる場合、言及された特徴、整数、ステップ、動作、要素、及び/又は成分の存在を指定するが、他の1つ以上の特徴、整数、ステップ、動作、要素、成分、及び/又はこれらの集団の存在又は追加を排除しないものと理解されたい。更に、ある要素が他の要素に「応答する」又は「接続されている」と称される場合、当該他要素に直接応答するか又は接続されていてよく、或いは介入要素が存在してもよい。対照的に、ある要素が他の要素に「直接応答する」又は「直接接続されている」と称される場合、介入要素が存在しない。本明細書で用いる用語「及び/又は」は、1つ以上の列挙された関連項目の全ての組み合わせを含み、「/」と略記される場合がある。
【0026】
本明細書で用語第1、第2、等は各種の要素の記述に用いられてよいが、当該要素がこれらの用語に限定されないことを理解されたい。これらの用語は、ある要素を別の要素と区別するために用いるに過ぎない。例えば、本実施形態の内容から逸脱することなく、第1の要素を第2の要素と称してよく、同様に第2の要素を第1の要素と称してもよい。
【0027】
いくつかの図面において、通信の主方向を示すべく通信経路上に矢印を含んでいるが、図示する矢印の逆方向でも通信が生起し得ることを理解されたい。
【0028】
いくつかの例について、各ブロックが回路要素、モジュール、又は指定された論理機能を実装するための1つ以上の実行可能な命令を含む符号の部分を表すブロック図及び動作フロー図に関連して記述している。また、他の実装において、ブロックに記述された機能が記述した順序から外れて生起し得ることに注意されたい。例えば、連続的に示す2ブロックが実際には、ほぼ並行して実行されてよく、又は当該ブロックが関係する機能に応じて逆の順序で実行される場合もあり得る。
【0029】
本明細書で「一例によれば」又は「一例において」の語句は、当該例との関連で記述された特定の特徴、構造、又は特徴が本実施形態の少なくとも一つの実装に含めることができることを意味する。本明細書の様々な箇所に出現する語句「一例によれば」又は「一例において」は必ずしも全てが同じ例を参照している訳ではなく、且つ別個又は代替的な例が他の例を相互に排除するものではない。
【0030】
請求項に出現する参照番号は説明目的に過ぎず、請求の範囲を限定する効果は有していないものとする。
【0031】
明示的に記述していないが、本例及び変型例は任意の組み合わせ又は部分的な組み合わせに用いられてよい。
【0032】
本実施形態は、1つの点群を表す2個の奥行き画像及び2個のテクスチャ画像の符号化/復号を記述しているが、点群のシーケンス(時間的に動的な点群)を表す奥行き画像の2個のシーケンス(ビデオ)及びテクスチャ画像の2個のシーケンス(ビデオ)の符号化/復号に拡張し、その理由は、点群のシーケンスの1つの点群のジオメトリ(2個の奥行き画像)及びテクスチャ(色)が次いで、当該点群のシーケンスの別の点群のジオメトリ(2個の奥行き画像)及びテクスチャ(色)とは独立に符号化/復号されるためである。
【0033】
上で説明したように、点群は投影面に正射され、前記投影された3D点に関連付けられた奥行き値から2個の奥行き画像D0、D1が取得される。D0は点群の最近点の奥行き値を表す第1の奥行き画像であり、D1は点群の最遠点の奥行き値を表す第2の奥行き画像である。第1の奥行き画像D0は、例えば従来の画像/ビデオエンコーダを用いて符号化される。
【0034】
以下において、用語「画像領域」は少なくとも1つの画像のピクセルの組を示す。これらのピクセルは近傍のピクセルであってもなくてもよく、及び/又は同一画像に属していても又は属していなくてもよいが、それら全てが少なくとも1つの共通特性を共有している。
【0035】
例えば、画像全体自身を画像領域と見なしてよい。1つの画像はまた、複数のブロックに分割することができ、1つのブロック又は複数ブロックの集団が画像領域となる。
【0036】
1つの画像領域はまた、非矩形の形状を有していてもよい。これは例えば、抽出された同一(又は類似)機能を有する1つの画像の複数のピクセルが関連付けられて画像領域を形成する場合である。1つの画像領域はTMC2に定義されているようなパッチであってよい。
【0037】
画像から抽出された特徴の例として色、テクスチャ、法線ベクトル等が挙げられる。
【0038】
図1に、本実施形態の一例による、点群の複数の点の奥行き値を符号化する方法100のステップを模式的に示す。
【0039】
ステップ110において、モジュールM1は、点群PCの少なくとも1つの点から、点群PCの前記少なくとも1つの点を投影面上に投影することにより、少なくとも1つの第1の点P0(p)を取得する。
【0040】
例えば、正射投影を用いてよい。
【0041】
各第1の点P0(p)に対して、ステップ100において、モジュールM1はまた、前記第1の点P0(p)に従い決定された点群PCの少なくとも1つの他の点P(n,0)を取得する。点P(n,0)は、N個の点の組の1つの点nを指し、添え字0は第1の点P0(p)を示す。
【0042】
ステップ110の一実施形態によれば、第1の点P0(p)に対応する点群PCの少なくとも1つの他の点P(n,0)が前記第1の点P0(p)周辺の近傍に属する。
【0043】
一実施形態によれば、第1の点P0(p)に対応する近傍は、前記第1の点P0(p)に近い、例えばこれらの点と第1の点P0(p)との空間距離が所与の値を下回る場合に、点群PCの複数の点を含んでいる。
【0044】
一実施形態によれば、近傍の複数の点は全て第1の点P0(p)に整列している。
【0045】
一実施形態によれば、第1の点P0(p)に関連付けられた近傍が、前記第1の点P0(p)に対して決定された補間符号化モードICMに従い定義される。
【0046】
近傍を定義するとは、要素、空間距離等の個数を定義することを意味する。
【0047】
一実施形態によれば、第1の点P0(p)に関連付けられた近傍は、当該第1の点P0(p)の周辺の画像領域である。
【0048】
ステップ120において、モジュールM2が、前記少なくとも1つの第1の点P0(p)から取得された少なくとも1つの再構築された点
【数1】
を取得する。
【0049】
ステップ120の一実施形態によれば、少なくとも1つの再構築された点
【数2】
を、第1の点P0(p)を符号化及び復号することにより取得する。
【0050】
ステップ130において、モジュールM3が、点群PCの前記少なくとも1つの他の点P(n,0)を近似すべく、前記少なくとも1つの第1の点P0(p)から取得された(ステップ120)少なくとも1つの再構築された点
【数3】
及び前記少なくとも1つの補間符号化モードICMにより定義された少なくとも1つの補間点PI(i,0)に基づいて前記少なくとも1つの第1の点P0(p)に対して少なくとも1つの補間符号化モードICMを決定する。
【0051】
補間点PI(i,0)は、第1の点P0(p)(添え字0)に対応するI個の補間点の組に属する1つの補間点iを示す。
【0052】
ステップ140において、モジュールM4が、前記少なくとも1つの第1の点P0(p)及び前記少なくとも1つの補間符号化モードICMをビットストリームBTに符号化する。
【0053】
ステップ120又は140の一実施形態によれば、前記少なくとも1つの第1の点P0(p)の奥行き値を、例えばHEVCエンコーダ/デコーダ又はTMC2により指定されたようなエンコーダ/デコーダ等、ビットストリームBTの従来の画像エンコーダにより符号化された第1の奥行き画像D0に割り当てる。
【0054】
ステップ120において当該実施形態によれば、第1の奥行き画像D0を復号することにより復号第1の奥行き画像
【数4】
が取得され、前記少なくとも1つの再構築された点
【数5】
は復号された第1の奥行き画像
【数6】
のピクセルである。
【0055】
ステップ130の一実施形態によれば、第1の点P0(p)の補間符号化モードICMの判定は、候補補間符号化モードCICMkに従い定義された少なくとも1つの補間点PIk(i,0)(i=1,...,Ik)により第1の点P0(p)に関連付けられた少なくとも1つの他の点P(n,0)(n=1,...,N)の特定の符号化を示す少なくとも1つの候補補間符号化モードCICMkに関連付けられたレート歪みコストRDCkに基づいている。
【0056】
1つの補間点PIk(i,0)は第1の点P0(p)(添え字0)に対応するIk個の補間点の組に属する補間点iを指し、Ikは候補補間符号化モードCICMkに従い定義された整数値である。
【0057】
ステップ130の一実施形態によれば、レート歪みコストRDCkは、ラグランジアン
RDCk=Dk+λk・Rk
により与えられ、ここで、Dkは候補補間符号化モードCICMkに対応する測定基準、Rkは候補補間符号化モードCICMkを符号化するビットレート、及びλkは前記候補補間符号化モードCICMkに対応するラグランジュ乗数である。
【0058】
ラグランジュ乗数λkに関して、当該乗数の値が大きければビットレートRkを強く阻害して符号化品質の低下を招く一方、当該乗数の値が小さければビットレートなRkの値が容易に増大して符号化品質が向上する。当該乗数は、画像符号化に用いられる量子化パラメータ(QP)と相関を有していてよい。当該乗数の典型的な値は、極めて低品質の符号化では数百から、良好な符号化では十分の一の範囲にある。これらの値は指標値であり、ビデオ内容に依存する場合もある。
【0059】
ステップ130の一実施形態によれば、補間符号化モードICMは、最低レート歪みコストRDCkに関連付けられた候補補間符号化モードCICMkであってよい。
【0060】
ステップ130の一実施形態によれば、前記レート歪みコストRDCkは、Ik個の補間点PIk(i,0)と他のN個の点P(n,0)との間の空間距離を示す測定基準に基づいている。
【0061】
一実施形態によれば、測定基準D
kは次式により与えられる。
D
k=Max(dist
point(A,B);dist
point(B,A))
但し
【数7】
ここで、
【数8】
は点の組Aの1つの点P(n,0)と点の組Bの最近補間点PI
k(i,0)との間の空間距離を示す測定基準である。例えば、測定基準としてユークリッド距離を使用し、AにおけるBの最近点P(n,0)は次式で定義される補間点Pl
k(i,0)である。
【数9】
【0062】
距離distpoint(A,B)は、再構築された点が第1の点から離れ過ぎないことを保証して符号化に無関係な点を除外する。距離distpoint(B,A)は、第1の点が再構築された点から離れ過ぎないことを保証する。
【0063】
一変型例によれば、本方法はレート歪みコストを計算する前に組Aの複製を除去することを含んでいる。
【0064】
ステップ130の一実施形態によれば、少なくとも1つの候補補間符号化モードCICM
kを、再構築された点
【数10】
の奥行き値から最大奥行き値までの範囲にわたる奥行き値が関連付けられた少なくとも1つの補間点PI
k(i,0)を生成することにより定義する。
【0065】
図2に示すステップ130の前記実施形態の一変型例によれば、少なくとも1つの候補補間符号化モードCICM
kが以下のように定義される。
【0066】
ステップ1300において、最大奥行き差(距離)
【数11】
を、再構築された点
【数12】
に関連付けられた奥行き値
【数13】
と、少なくとも1つの点P(n,0)の奥行きD(n,0)との間で計算する。
【数14】
【0067】
一変型例によれば、
【数15】
とD(n,0)の差は、下限LB及び上限UBにより定義される値の所与の範囲に属する場合は無視される。例えば、LB=0且つUB=4である。
【0068】
値の所与の範囲に属する差が無い場合、最大奥行き差
【数16】
を1に設定してよい。
【0069】
次いで、例えばLB及びUBの異なる値を選択することにより、複数の候補補間符号化モードCICMkを決定することができる。この場合、デコーダは補間符号化モードICMkの特定の値からこれらの値を事前に認識しているため、限界LB及びUBを送信する必要がない。
【0070】
典型的には、LB=0且つUB=1で1つの候補補間モードを、LB=0且つUB=2で別の1つ、LB=0且つUB=4で更に別の1つを定義することができる。
【0071】
ステップ1310において、最大奥行き差(距離)
【数17】
に従い少なくとも1つの補間点を生成する。
【0072】
図3に示すステップ1310の一変型例によれば、UB(閾値)=4の場合、生成された全ての補間点が再構築された点
【数18】
に整列しており、新たな補間点に奥行き値を連続的に割り当てる際にステップサイズ1を用いる。
【0073】
より詳細には、少なくとも1つの補間点を以下のように作成する。
・
【数19】
が0又は1に等しい場合、
【数20】
と同一奥行き値を有する同一位置pに単一の補間点を生成する。
図3において、×印20は点
【数21】
と重なっている。
・
【数22】
が1よりも大きい場合、
【数23】
と同一位置pを少なくとも1つの補間点を生成し、生成された各補間点には、再構築された点
【数24】
の奥行き値から最大奥行き値までの範囲の奥行き値が関連付けられていて、新たに生成された補間点に奥行き値を連続的に割り当てる際にステップサイズ1を用いる。
【0074】
【0075】
図3では明快さのため単一の点P(n,0)だけを示していることに注意されたい。
【0076】
図3aに示す一変型例によれば、全て補間点を同一軸に沿って(すなわち現在点の上に)整列するのではなく、補間点の上半分がdeltaMaxの値を設定する近傍点に整列している。
【0077】
一変型例によれば、最大奥行き差は少なくとも最小値minDepthに等しい。
【数25】
ここで、minDepthは再構築される表面の厚さに依存する所与の値である。
【0078】
次いで複数の候補補間符号化モードCICMkを、minDepthの異なる値、典型的には0、1又は2を選択することにより決定することができる。
【0079】
ステップ130の一実施形態によれば、レート歪みコストRDCkはまた、Ik個の補間点PIk(i,0)の色と、他のN個の点P(n,0)の色との間の色距離を示す測定基準に基づいている。
【0080】
一実施形態によれば、測定基準D
kは次式で与えられる。
D
k=Max(dist
geo+text(A,B);dist
geo+text(B,A))
但し
【数26】
ここで、μは係数が例えば0.25に等しい重み係数であり、
【数27】
但し、
D
y=Y
p-Y
closest(P(n,0) ,B)
D
u=U
p-U
closest(P(n,0) ,B)
D
v=V
p-V
closest(P(n,0) ,B)であり、
三つ組(Y
p,U
p,V
p)はYUV色空間内の点P(n,0)の色を示し、三つ組(Y
closest(P(n,0) ,B),U
closest(P(n,0) ,B),V
closest(P(n,0) ,B))はYUV色空間内の前記点P(n,0)に最も近い補間点Pl
k(i,0)の色を示す。
【0081】
一実施形態によれば、少なくとも1つの候補補間符号化モードCICMkはまた、少なくとも1つの補間点にどのように色が割り当てられるかを定義する。
【0082】
一実施形態によれば、補間点に割り当てられた色は、前記補間点に最も近い再構築された点の色である。
【0083】
一変型例において、補間点に割り当てられた色は、前記補間点の近傍の再構築された色の関数である。関数は、例えば加重平均、最大又は最小を意味する。
【0084】
ステップ110の一実施形態によれば、近傍とは画像領域であり、すなわち第1の点P0(p)に関連付けられた点群PCの前記少なくとも1つの他の点P(n,0)は画像領域に属する。
【0085】
一実施形態によれば、レート歪みコストは、前記画像領域の画像部分領域に対して決定されたレート歪みコストを加算することにより取得される。
【0086】
一実施形態によれば、レート歪みコストは、異なる形状及び/又は異なる大きさの複数の画像領域に対して決定され、画像領域の形状及び/又は大きさと、前記最小レート歪みコストに関連付けられた補間符号化モードが選択される。
【0087】
ステップ140の一実施形態によれば、補間符号化モードICMは、画像領域に関連付けられたメタデータとして符号化される。
【0088】
一変型例において、2個の異なる画像領域に割り当てられた2個の補間符号化モード間の差異がメタデータとして符号化される。
【0089】
例えば、パッチ毎に、各モードRDCk(又は2個のRDCkの差異)が以下のようにビットストリームBT内の各パッチkに対してシグナリングされる。
【0090】
【0091】
例えば、ブロック毎に、各モードRDCk(又は2個のRDCkの差異)がビットストリームBTの各ブロックkに対してシグナリングされる。
【0092】
【0093】
図4に、本実施形態の一例による、ビットストリームから点群の点の奥行き値を復号する方法200のステップを模式的に示す。
【0094】
ステップ210において、モジュールM5はビットストリームBTから少なくとも1つの再構築された点
【数28】
を取得する。
【0095】
ステップ210の一実施形態によれば、モジュールM5はビットストリームBTを復号することにより復号された第1の奥行き画像
【数29】
を取得して、前記復号された第1の奥行き画像
【数30】
の少なくとも1つのピクセルに対応する少なくとも1つの再構築された点
【数31】
を考慮する。
【0096】
ステップ220において、モジュールM6はビットストリームBTから少なくとも1つの補間符号化モードICMを取得し、補間符号化モードICMが、前記少なくとも1つの再構築された点の近傍の少なくとも1つの点が少なくとも1つの他の補間点によりどのように近似されるかを示している。
【0097】
ステップ220の一実施形態によれば、少なくとも1つの補間符号化モードICMが、ビットストリームBTから抽出されたメタデータから取得される。
【0098】
ステップ230において、モジュールM7が、少なくとも1つの再構築された点
【数32】
の少なくとも1つの補間点PI(i,0)を生成し、前記少なくとも1つの補間符号化モードICMに従い、前記少なくとも1つの補間点の各々に奥行き値が関連付けられている。
【0099】
次いで再構築された点群が、再構築された点
【数33】
及び補間点PI(i,0)から取得される。
【0100】
ステップ230の一実施形態によれば、前記少なくとも1つの補間点に関連付けられた奥行き値は、再構築された点
【数34】
の奥行き値から最大奥行き値までの範囲にある。
【0101】
一実施形態によれば、再構築された点
【数35】
に対応する全ての生成された補間点が、再構築された点
【数36】
に整列され、新たな補間点に奥行き値を連続的に割り当てる際にステップサイズ1が用いられる。
【0102】
ステップ230の前記実施形態の一変型例によれば、
図2に示すようにステップ130の実施形態の一変型例に従い少なくとも1つの補間点が生成される。
【0103】
本方法の一実施形態によれば、ステップ210において、本方法は更に、少なくとも1つの再構築された点
【数37】
を含む少なくとも1つの画像領域を取得することを含んでいる。
【0104】
ステップ220において、次いで補間符号化モードICMが画像領域毎にビットストリームBTから取得され、前記補間符号化モードICMは、画像領域内の複数の点が少なくとも1つの他の補間点によりどのように近似されるかを示している。
【0105】
ステップ230において、次いで画像領域毎に少なくとも1つの補間点が、前記画像領域に関連付けられた補間符号化モードICMに従い生成され、前記少なくとも1つの補間点の各々に奥行き値が関連付けられている。
【0106】
図5に、ジオメトリを符号化する方法及びTMC2に定義された点群のテクスチャを模式的に示す。
【0107】
基本的に、エンコーダは、第1(D0)及び第2(D1)の奥行き画像内の点群PCのジオメトリ情報を捕捉する。
【0108】
一例として、第1及び第2の奥行き画像は以下のようにTMC2に取得される。
【0109】
奥行きパッチ(点群PCの3D点の組)は、これらの点で法線ベクトルに従い点群PCの複数の点をクラスタリングすることにより取得される。抽出された全ての奥行きパッチは次いで、未使用空間の最小化を試みながら、2D格子に、当該格子の全てのT×T(例:16×16)ブロックが一意なパッチに関連付けられていることを保証しながら、投影及びパッキングされ、Tはビットストリームにシグナリングされたユーザー定義パラメータである。
【0110】
次いで奥行き画像が、パッキング処理を通じて計算された3Dから2Dへのマッピング、より具体的には各パッチの投影領域のパッキング位置及び大きさを利用することにより生成される。より厳密には、H(u,v)を同一ピクセル(u,v)に投影された現在のパッチの点の組とする。最も近い層又は第1の奥行き画像D0とも呼ばれる第1層は最小奥行き値を有するH(u,v)の点を保存する。最も遠い層又は第2の奥行き画像D1とも呼ばれる第2層は、区間[D,D+Δ]内で最大の奥行き値を有するH(u,v)の点を捕捉し、Dは第1の奥行き画像D0内のピクセルの奥行き値、Δは表面の厚さを記述するユーザー定義パラメータである。
【0111】
第1の奥行き画像D0は次いでパッキング処理を出力する。パディング処理も用いて、ビデオ圧縮に適した区分的に滑らかな第1の奥行き画像を生成すべくパッチ間の空白を埋める。
【0112】
生成された奥行き画像/層D0及びD1は次いで、ビデオフレームとして保存され、HEVC等、任意の従来型ビデオコーデックを用いて圧縮される。
【0113】
エンコーダはまた、第1及び第2の奥行き画像を符号化/復号して、前記復号された第1及び第2の奥行き画像
【数38】
を逆投影することにより点群のジオメトリを再構築することにより2個のテクスチャ画像内の元の点群PCのテクスチャ情報を捕捉する。再構築されたならば、再構築された点群の各点に、色情報符号化エラーを最小化するように元の点群PCの色情報から色が割り当てられる(色変換)。
【0114】
一実施形態によれば、各々の再構築された点に対して、元の点群における最近点の色が符号化される自身の色として割り当てられる。
【0115】
次いで第1及び第2のテクスチャ画像T0、T1が、奥行き画像と同一位置、すなわち(i,u,v)にある各々の再構築された点の符号化される色情報を保存することにより生成される。
【0116】
図6に、
図5の符号化方法における方法100及び200の一使用例を模式的に示す。
【0117】
本例によれば、
図5の第2の奥行き画像D1の符号化が
図1の符号化方法100で代替され、
図5の第2の奥行き画像
【数39】
の復号が
図4の復号方法200で代替される。
【0118】
図6aに示す一変型例において、
図5の第1及び第2の奥行き画像の符号化が
図1の符号化方法100に関連付けられ、
図5の第1及び第2の奥行き画像の復号が
図4の復号方法200に関連付けられている。
【0119】
図7に、従来技術(TMC2)で定義された点群のジオメトリ及びテクスチャを復号する方法を模式的に示す。
【0120】
復号された第1の奥行き画像
【数40】
及び復号された第2の奥行き画像
【数41】
がビットストリームBTを復号することにより取得される。恐らくメタデータもまた点群
【数42】
のジオメトリを再構築すべく復号される。
【0121】
点群のジオメトリは従って、前記復号された第1及び第2の奥行き画像並びに恐らくは前記メタデータを逆投影することにより再構築される。
【0122】
図8に、
図7の復号方法における方法200の一使用例を模式的に示す。
【0123】
本例によれば、
図7の第1及び第2の奥行き画像の復号が
図4の復号方法により代替される。
【0124】
図8aに示す一変型例において、
図7の第1及び第2の奥行き画像の復号が
図4の復号方法200に関連付けられている。
【0125】
図1~8aにおいて、モジュールは機能ユニットであり、区別可能な物理ユニットと関連していてもいなくてもよい。例えば、これらのモジュール又はその一部が、一意な要素又は回路にまとめられていてよく、又はソフトウェアの機能に寄与することができる。逆に、いくつかのモジュールは潜在的に別個の物理的実体からなっていてよい。本実施形態と互換性を有する装置は、純粋のハードウェアを用いて、例えばASIC又はFPGA或いはVLSI(各々「特定用途向け集積回路」、「フィールドプログラマブルゲートアレイ」、「超大規模集積回路」)等の専用ハードウェアを用いて、又は機器に埋め込まれたいくつかの一体化電子部品、或いはハードウェア及びソフトウェア部品の組み合わせにより実装される。
【0126】
図9に、各種の態様及び実施形態が実装されたシステムの一例のブロック図を示す。システム9000は、後述の各種要素を含む機器として実現され得、本出願に記述する1つ以上の態様を実行すべく構成されている。このような機器の例として、各種の電子機器、例えばパーソナルコンピュータ、ラップトップコンピュータ、スマートフォン、タブレットコンピュータ、デジタルマルチメディアセットトップボックス、デジタルテレビ受信機、個人ビデオ録画システム、接続された家電製品、及びサーバが含まれるがこれらに限定されない。システム9000の素子は、単独に又は組み合わせて、単一の集積回路、複数のIC、及び/又は離散的要素に実装することができる。例えば、少なくとも一つの実施形態において、システム9000の処理及びエンコーダ/デコーダ素子は、複数のIC及び/又は離散的要素にわたり分散されている。各種実施形態において、システム9000は、例えば通信バスを介して、又は専用の入力及び/又は出力ポートを通して、他の類似システム又は他の電子機器に通信可能に結合されている。各種実施形態において、システム9000は本明細書に記述する1つ以上の態様を実装すべく構成されている。
【0127】
システム9000は、例えば本明細書に記述する各種態様を実行すべくロードされた命令を実行すべく構成された少なくとも1つのプロセッサ9010を含んでいる。プロセッサ9010は、埋め込みメモリ、入出力インターフェース、及び当該技術分野で公知の各種の他の回路を含んでいてよい。システム9000は、少なくとも1つのメモリ9020(例:揮発性メモリ素子及び/又は不揮発性メモリ素子)を含んでいる。システム9000は、EEPROM、ROM、PROM、RAM、DRAM、SRAM、フラッシュ、磁気ディスクドライブ及び/又は光ディスクドライブを含むがこれらに限定されない記憶装置9040を含む不揮発メモリ及び/又は揮発性メモリを含んでいてよい。記憶装置9040は、非限定的な例として、内部記憶装置、外付け記憶装置、及び/又はネットワークアクセス可能な記憶装置を含んでいてよい。
【0128】
システム9000は、例えば符号化ビデオ又は復号ビデオを提供すべくデータを処理すべく構成されたエンコーダ/デコーダモジュール9030を含み、エンコーダ/デコーダモジュール9030は自身のプロセッサ及びメモリを含んでいてよい。エンコーダ/デコーダモジュール9030は、符号化及び/又は復号機能を実行すべく装置に含まれていてよいモジュールを表す。公知のように、1つの装置が符号化及び復号モジュールの一方又は両方を含んでいてよい。また、エンコーダ/デコーダモジュール9030は、システム9000の別個の要素として実装されていても、又は当業者には公知のようにハードウェア及びソフトウェアの組み合わせとしてプロセッサ9010内に組み込まれていてよい。
【0129】
本明細書に記述する各種の態様を実行すべくプロセッサ9010又はエンコーダ/デコーダ9030にロードされるプログラムコードは、記憶装置9040に保存されて、次いでプロセッサ9010により実行すべくメモリ9020にロードされてよい。各種実施形態によれば、プロセッサ9010、メモリ9020、記憶装置9040、及びエンコーダ/デコーダモジュール9030のうち1つ以上が、本明細書に記述する処理を実行する間、1つ以上の各種項目を保存することができる。保存されたそのような項目は、入力ビデオ、復号ビデオ、点群、再構築された点群又は復号ビデオの一部、ビットストリーム、マトリクス、変数、及び数式、公式、動作、及び動作論理の処理から中間又は最終結果を含んでいてよいが、これらに限定されない。
【0130】
いくつかの実施形態において、プロセッサ9010及び/又はエンコーダ/デコーダモジュール9030内のメモリを用いて命令を保存して、符号化又は復号に際して必要な処理用の作業メモリを提供する。
【0131】
しかし他の実施形態では、これらの機能の1つ以上に対して処理装置(例:処理装置はプロセッサ9010又はエンコーダ/デコーダモジュール9030のいずれかであってよい)の外部メモリが用いられる。外部メモリは、メモリ9020及び/又は記憶装置9040、例えば動的揮発性メモリ及び/又は不揮発性フラッシュメモリであってよい。いくつかの実施形態において、外部不揮発性フラッシュメモリを用いてテレビのオペレーティングシステムを保存する。少なくとも一つの実施形態において、ビデオ符号化及び復号動作、例えばMPEG-2、HEVC、VVC(多用途ビデオ符号化)又はTMC2用にRAM等の高速外部動的揮発性メモリが作業メモリとして用いられる。
【0132】
システム9000の要素への入力はブロック9130に示すような各種の入力装置を介して提供することができる。このような入力装置は(i)例えばブロードキャスタにより無線送信されたRF信号を受信するRF部、(ii)複合入力端末、(iii)USB入力端末、及び/又は(iv)HDMI入力端末を含むがこれらに限定されない。
【0133】
各種実施形態において、ブロック9130の入力装置には当該技術分野で公知の各入力処理要素が関連付けられている。例えば、RF部には(i)所望の周波数を選択すること(信号選択、又は複数周波数の帯域への信号の帯域制限とも呼ばれる)、(ii)選択信号の下方変換、(iii)(例えば)特定の実施形態でチャネルとも呼ばれる信号周波数帯を選択すべく複数周波数のより狭い帯域への再帯域制限、(iv)下方変換及び帯域限定された信号の復調、(v)誤り訂正の実行、及び(vi)データパケットの所望のストリームを選択するための非多重化に必要な要素が関連付けられていてよい。各種実施形態のRF部は、これらの機能を実行する1つ以上の要素、例えば周波数セレクタ、信号セレクタ、帯域リミッタ、チャネルセレクタ、フィルタ、ダウンコンバータ、復調器、エラー訂正器、及びデマルチプレクサを含む。RF部は、例えば受信した信号のより低い周波数(例:中間周波数又は近ベースバンド周波数)又はベースバンドへの下方変換を含むこれらの機能の多くを実行するチューナを含んでいてよい。
【0134】
セットトップボックスの一実施形態において、RF部及び関連付けられた入力処理要素は、有線の(例:ケーブル)媒体を介して送信されたRF信号を受信して、フィルタリング、下方変換、及び再度フィルタリングにより周波数選択を実行して所望の周波数帯が得られる。
【0135】
各種実施形態は、上述の(及び他の)要素の順序を再配置し、これらの要素のいくつかを除去する、及び/又は類似又は異なる機能を実行する他の要素を追加する。
【0136】
要素の追加は、既存の要素の間への挿入要素、例えば増幅器及びアナログ/デジタル変換器の挿入を含んでいてよい。各種実施形態において、RF部はアンテナを含んでいる。
【0137】
また、USB及び/又はHDMI端末は、USB及び/又はHDMI接続を介してシステム9000を他の電子機器に接続するための各インターフェースプロセッサを含んでいてよい。入力処理の各種の態様、例えばリードソロモン誤り訂正が必要に応じて例えば別個の入力処理IC内又はプロセッサ9010内に実装できることを理解されたい。同様に、USB又はHDMIインターフェース処理の態様は、必要に応じて別個のインターフェースIC内又はプロセッサ9010内に実装することができる。復調及びエラー訂正され、且つ非多重化されたストリームは、各種の処理要素、例えばプロセッサ9010、及び出力装置での表示のため必要に応じてデータストリームを処理すべくメモリ及び記憶要素と組み合わせて動作するエンコーダ/デコーダ9030に送られる。
【0138】
システム9000の各種の要素は、一体化された筐体内に設けられていてよい。各種の要素は、一体化された筐体内で相互接続されていて、適当な接続構成、例えばI2Cバスを含む当該技術分野で公知の内部バス、配線、及び印刷基板を用いて互いにデータを送信することができる。
【0139】
システム9000は、通信チャネル9060を介して他の機器との通信を可能にする通信インターフェース9050を含んでいる。通信インターフェース9050は、通信チャネル9060を介してデータを送受信すべく構成されたトランシーバを含むが、これに限定されない。通信インターフェース9050はモデム又はネットワークカードを含んでいてよいがこれらに限定されず、通信チャネル9060は、例えば有線及び/又は無線媒体内に実装することができる。
【0140】
データは各種実施形態において、IEEE802.11等のWi-Fiネットワークを用いてシステム9000にストリーミングされる。これらの実施形態のWi-Fi信号は、Wi-Fi通信に適合された通信チャネル9060及び通信インターフェース9050を介して受信される。これらの実施形態の通信チャネル9060は典型的に、ストリーミングアプリケーション及び他のオーバーザトップ通信を可能にするインターネットを含む外部ネットワークへのアクセスを可能にするアクセス点又はルータに接続されている。
【0141】
他の実施形態は、入力ブロック9130のHDMI接続を介してデータを配信するセットトップボックスを用いてシステム9000にストリーミングデータを提供する。
【0142】
更に他の実施形態が入力ブロック9130のRF接続を用いてシステム9000にストリーミングデータを提供する。
【0143】
システム9000は、ディスプレイ9100、スピーカー9110、及び他の周辺装置9120を含む各種の出力装置に出力信号を与えることができる。他の周辺装置9120は、実施形態の各種の例において、スタンドアローンDVR、ディスクプレーヤ、ステレオシステム、照明システム、システム9000の出力に基づいて機能を提供する他の1つ以上の装置を含んでいる。
【0144】
各種実施形態において、AV.Link、CEC等のシグナリング、又はユーザーの介在の有無に依らず装置同士の制御を可能にする他の通信プロトコルを用いて、システム9000とディスプレイ9100、スピーカー9110、又は他の周辺装置9120との間で制御信号が受け渡される。
【0145】
出力装置は、各インターフェース9070、9080、及び9090を通じて専用接続を介してシステム9000に通信可能に結合されていてよい。
【0146】
代替的に、出力装置は、通信チャネル9060を用いて通信インターフェース9050を介してシステム9000に接続されていてよい。ディスプレイ9100及びスピーカー9110は、例えばテレビ等の電子機器内でシステム9000の他の要素と単一ユニットに一体化されていてよい。
【0147】
各種実施形態において、表示インターフェース9070は例えばタイミングコントローラ(TCon)チップ等のディスプレイドライバを含んでいる。
【0148】
ディスプレイ9100及びスピーカー9110は代替的に、例えば入力9130のRF部が別個のセットトップボックスの一部である場合、1つ以上の他の要素とは別個であってよい。ディスプレイ9100及びスピーカー9110が外部要素である各種実施形態において、出力信号は例えばHDMIポート、USBポート、又はCOMP出力を含む専用出力接続を介して与えることができる。
【0149】
図10に示す本実施形態の一例によれば、通信ネットワークNETを介した2個の遠隔装置AとBの間の送信に際して、装置Aは、
図1~3a又は
図5~6との関連で記述した方法を実装すべく構成されたメモリRAM及びROMに関連するプロセッサを含み、装置Bは、
図4又は
図7~8との関連で記述した方法を実装すべく構成されたメモリRAM及びROMと関連するプロセッサを含んでいる。
【0150】
一例によれば、当該ネットワークは、装置Aからの装置Bを含む復号装置へ静止画像又はビデオ画像をブロードキャストすべく適合されたブロードキャストネットワークである。
【0151】
装置Aによる送信を意図された信号がビットストリームBTを担持する。
【0152】
ビットストリームBTは、1つの点群の複数の点の奥行き値を表す符号化データを含んでいる。当該点群の少なくとも1つの再構築された点、及び前記少なくとも1つの再構築された点の近傍の少なくとも1つの点が少なくとも1つの他の補間点によりどのように近似されるかを示す少なくとも1つの補間符号化モードを含んでいる。
【0153】
前記符号化データは、例えば
図1~3aとの関連で記述したように取得される。
【0154】
図11に、パケット方式の送信プロトコルを介してデータが送信された場合におけるこのような信号の構文の一例を示す。各々の送信されたパケットPは、ヘッダH及びペイロードPAYLOADを含んでいる。例えばヘッダHの1ビットが、補間符号化モードICMを表す専用ビットである。従って、ヘッダHの少なくとも1ビットは、少なくとも1つの補間符号化モードICMを表す専用ビットである。
【0155】
TMC2における空間適合再構築モードの実装は以下の通りである。
1.単一の奥行き及びテクスチャ層の符号化の可能性:現在、TMC2は常に二つの層を符号化する。エラー!参照元不明。
これは、GOPレベルでのエンコーダパラメータ/ビットストリームパラメータ、すなわち奥行き及びテクスチャ層の個数(両方で等しい)の信号への追加により実装される。
2.単層モードにおける、点局所再構築モード(PLRM)と呼ばれる点再構築モードを局所的に適合させる最適化フレームワークの点群の特徴への使用。最適化は、エンコーダにおけるRDO的アプローチを用いて、点毎に使用する局所再構築モードをデコーダが知るように要求されたシグナリングをビットストリームに追加することで実行される。これは、ある領域の大きさで(占有マップ解像度でのブロック、文献では16×16ピクセル)で実行される。当該処理は点局所再構築フレームワーク(PLRF)と称する。
【0156】
PLRMのシグナリングは専用の算術エンコーダを必要とし、エンコーダ及びデコーダの複雑さが増す。
【0157】
少なくとも一つの実施形態は、点局所再構築モードPLRM、すなわち少なくとも1つの補間符号化モードに関するデータを画像データとして搬送(シグナリング)することに関する。
【0158】
予測される各モードは、(算術エンコーダを用いて)補助パッチ情報に符号化されたメタデータ情報をパッチするブロックに符号化される。現在の実装では最大10個の異なるモードを試す。
図12に、エンコーダ側で決定された異なるモードと、レート及び構成(全てイントラモード、ランダムアクセスモード)を考慮したTMC2v3.0ソフトウェアにおける各モードの使用の分布を示す。
【0159】
実装に際して、PLRMに関するデータが、メタデータをパッチするブロックを用いてデコーダへ送られ、算術エンコーダにより符号化される。
【0160】
占有マップ(占有マップ精度B0×B0ブロック、すなわち4×4ピクセル)は、(HEVCを用いて)ビデオとして符号化されている。占有マップは、格子の各セル毎に空の空間又は点群のいずれに属するかを示すバイナリマップを含んでいる。占有マップの使用は、このような情報を搬送(シグナリング)すべくPLRFのケースに拡張できる。
【0161】
本実施形態の少なくとも一つは、PLRMを、そのような情報を現在のTMC2に符号化する際に使用できる最も可能性が高いモードである占有マップに符号化する仕方に関する。
【0162】
主たる発想は、占有マップが点局所再構築モードに関する情報の搬送にどのように使用できるかを示すことである。現在まで、占有マップは、
図12に示すように、対応する3Dブロック(点群)が空であることを示す「0」、又は3Dブロックが完全に占有されていることを示す「1」を含んでいる。少なくとも一つの実施形態が、PLRMを示すより多くの値を取得する。
【0163】
より詳細には、本実施形態の少なくとも一つは以下の方法に関する。
各ブロックにおいて占有マップ精度(4*4)でPLRMは以下のように設定される。
-ブロックが空ならばブロックは0に設定される。
-ブロックが占有されていれば、ブロックに割り当てられる値は範囲[1...N]の点局所再構築モードに対応し、Nは適用する点局所再構築モードの最大個数である。値「1」は依然としてブロックが占有されていることを示し、本モードでは再構築された点群に補足点は追加されないことに注意されたい。
【0164】
一実装によれば、点局所再構築モードが占有マップ解像度(16*16)であるため、占有マップ精度(4*4)での各ブロックに関する情報は、当該ブロックが占有されていなく且つその場合に0に設定されていない限り繰り返される。
【0165】
図13aに、PLRMが
図13の例の占有マップにどのように符号化できるかの一例を示す。同図は4個のモード「1」、「2」、「5」及び「7」の使用を示している。「0」は再構築されたブロックが空であることを意味する。
【0166】
PLRMが占有精度(4*4)で実行できることに注意されたい。その場合、PLRMの符号化情報は
図13bに示すようにブロック毎に異なり得る。これにより再構築処理の精度が高まる。
【0167】
PLRM符号化の一変型例は、異なる種類の再構築(PLRM及び適用できる他の再構築方法)に値の複数の範囲を割り当てるものである。
-ブロックが空ならば、ブロックは(現時点で)0に設定される。
-ブロックが占有されていれば、PLRMを割り当てるべく第1の範囲[0;m]を、及び群再構築の別の方法を記述する情報を割り当てるべく第2の範囲[m;N]予約する。
【0168】
実装の別の変型例はビットマスクを用いるものである。
-ブロックが空ならば、ブロックは(現時点で)0に設定される。
-ブロックが占有されていれば、当該要素のNビットを、
・先頭nビットにPLRMを割り当て、
・他方の再構築モードを示すために(N-n)ビットを割り当てる
ことにより用いる。
【0169】
一例として、10ビットに符号化された要素のうち、4ビットを用いて情報「I」を符号化し、他の6個のビットを用いてPLRM情報を符号化する。
【0170】
【0171】
実装の別の変型例は、ハッシュマップを用いて異なるPLRMを決定するものである。各層毎にPLRMを指定できる。
【0172】
一例として、PLRM0が層0の再構築符号化モードであれば、PLRM1は層1の再構築符号化モード、PLRM2は層2の再構築符号化モードであり、占有マップは以下のように満たすことができる。
-ブロックが空ならば、ブロックは(現時点で)0に設定される。
-ブロックが占有されていれば、ハッシュテーブルは以下の通りであり得る。
【0173】
【0174】
別の変型例は、占有マップの彩度要素を用いてPLRM情報を符号化するものであり得る。
【0175】
主な利点は、データを補助パッチ情報に符号化することを回避して、既存ハードウェアによる占有マップのビデオ圧縮を利用するものである。
【0176】
上記は、コレクタとして点群をどのように再構築するかに関する占有マップ情報を用いる考えに従うものである。
【0177】
点局所再構築モードをどのようにTMC2内へ搬送できるかに関して最もあり得るケースであることに注意されたい。
【0178】
本明細書に記述した各種の処理及び特徴の実装は、各種の異なる設備又はアプリケーションにおいて実現することができる。このような設備の例として、エンコーダ、デコーダ、デコーダからの出力を処理するポストプロセッサ、エンコーダに入力を与えるプリプロセッサ、ビデオコーダー、ビデオデコーダ、ビデオコーデック、ウェブサーバ、セットトップボックス、ラップトップ、パーソナルコンピュータ、携帯電話、PDA、及び他の任意の画像又はビデオ処理装置又は他の通信装置が含まれる。明らかになるように、当該設備は移動可能であって、乗物に設置されていてもよい。
【0179】
また、上述の方法はプロセッサにより実行される命令により実行されてよく、そのような命令(及び/又は実行により生成されたデータ値)は計算機可読記憶媒体に保存されてよい。計算機可読記憶媒体は、1つ以上の計算機可読媒体に実現されていてコンピュータにより実行可能な計算機可読プログラムコードを有する計算機可読プログラム製品の形式をとることができる。本明細書で用いる計算機可読記憶媒体は、情報を保存する固有の能力と合わせて情報を取り出す固有の能力が与えられた非一時的記憶媒体と考えられる。コンピュータ可読記憶媒体は例えば電子、磁気、光、電磁、赤外、又は半導体システム、装置、又は機器、或いは上述の任意の適当な組み合わせであってよいが、これらに限定されない。以下に本実施形態を適用できる計算機可読記憶媒体のより具体的な例、すなわちポータブルコンピュータディスケット、ハードディスク、読み出し専用メモリ(ROM)、消去可能プログラム可能読み出し専用メモリ(EPROM又はフラッシュメモリ)、可搬コンパクトディスク読み出し専用メモリ(CD-ROM)、光記憶装置、磁気記憶装置、又は上述の任意の適当な組み合わせを挙げるが、当業者には容易に理解できるように単に説明目的に過ぎず、網羅的ではないことを理解されたい。
【0180】
命令は、プロセッサ可読媒体に有形的に実現されたアプリケーションプログラムを形成していてよい。
【0181】
命令は、例えばハードウェア、ファームウェア、ソフトウェア、又はこれらの組み合わせであってよい。命令は、例えばオペレーティングシステム、別個のアプリケーション、又は両者の組み合わせに見ることができる。従ってプロセッサは、例えば、処理を実行すべく構成された装置、及び処理を実行する命令を有するプロセッサ可読媒体(記憶装置等)を含む装置として特徴付けることができる。更に、プロセッサ可読媒体は、命令に加え、又はこれに替えた、実行により生成されたデータ値を保存することができる。
【0182】
当業者には明らかであろうが、複数の実装により、例えば保存又は送信可能な情報を担持すべく形式化された各種の信号を生成することができる。情報は例えば、方法を実行する命令、又は上述の実行の一つにより生成されたデータを含んでいてよい。例えば、信号は、本実施形態に記述する例の構文を読み書きする規則をデータとして担持すべく、又は本実施形態に記述する一例により書かれた実際の構文値をデータとして担持すべく形式化されていてよい。そのような信号は例えば、(例:スペクトルの無線周波数部分を用いて)電磁波として、又はベースバンド信号として形式化されていてよい。形式化は例えば、データストリームを符号化すること、及び符号化されたデータストリームと共に搬送波の変調することを含んでいてよい。信号が担持する情報は、例えばアナログ又はデジタル情報であってよい。信号は、公知のように広範な異なる有線又は無線リンクを介して送信されてよい。信号はプロセッサ可読媒体に保存されてよい。
【0183】
多くの実装について記述してきた。しかし、各種の変更を加え得ることを理解されたい。例えば、異なる実装の要素の組み合わせ、補完、変更、又は除去により他の実装を行ってもよい。また、当業者には開示する構造及び処理を他の構造及び処理で代替してよく、且つ結果的に得られた実装が少なくともほぼ同じ方法で少なくとも実質的に同一の機能を発揮して、開示する実装と少なくともほぼ同一の結果を実現できることが理解されよう。従って、これら及び他の実装が本出願により考察される。