(19)【発行国】日本国特許庁(JP)
(12)【公報種別】特許公報(B2)
(11)【特許番号】
(24)【登録日】2024-10-28
(45)【発行日】2024-11-06
(54)【発明の名称】点群の処理
(51)【国際特許分類】
H04N 19/597 20140101AFI20241029BHJP
H04N 19/30 20140101ALI20241029BHJP
H04N 19/70 20140101ALI20241029BHJP
【FI】
H04N19/597
H04N19/30
H04N19/70
(21)【出願番号】P 2021574782
(86)(22)【出願日】2020-06-22
(86)【国際出願番号】 EP2020067285
(87)【国際公開番号】W WO2021001186
(87)【国際公開日】2021-01-07
【審査請求日】2023-06-15
(32)【優先日】2019-07-03
(33)【優先権主張国・地域又は機関】EP
(73)【特許権者】
【識別番号】518341334
【氏名又は名称】インターディジタル・シーイー・パテント・ホールディングス・ソシエテ・パ・アクシオンス・シンプリフィエ
(74)【代理人】
【識別番号】100079108
【氏名又は名称】稲葉 良幸
(74)【代理人】
【識別番号】100109346
【氏名又は名称】大貫 敏史
(74)【代理人】
【識別番号】100117189
【氏名又は名称】江口 昭彦
(74)【代理人】
【識別番号】100134120
【氏名又は名称】内藤 和彦
(74)【代理人】
【識別番号】100108213
【氏名又は名称】阿部 豊隆
(72)【発明者】
【氏名】リカード,ジュリアン
(72)【発明者】
【氏名】グーデ,セリーヌ
(72)【発明者】
【氏名】ラック,ジョアン
【審査官】田中 純一
(56)【参考文献】
【文献】特表2021-528917(JP,A)
【文献】国際公開第2020/005365(WO,A1)
(58)【調査した分野】(Int.Cl.,DB名)
H04N 7/12
H04N 19/00 - 19/98
IEEE Xplore
(57)【特許請求の範囲】
【請求項1】
3D点群を復号する方法であって、
-データストリームから第1のレイヤ化画像および関連付けられた第1のメタデータを復号することであって、前記第1のメタデータは、前記第1のレイヤ化画像が点局所再構築法に従って復号されるかどうかを示す第1の情報を含む、ことと、
-前記第1の情報が有効になっていることを条件に、
前記第1のメタデータにおける第1の点局所再構築情報および第1の点局所再構築モードを取得することと、
前記3D点群を再構築するために、前記第1の点局所再構築情報に従って前記第1の点局所再構築モードを前記第1のレイヤ化画像に適用することと、
-前記データストリームから第2のレイヤ化画像および関連付けられた第2のメタデータを復号することであって、前記第2のメタデータは、前記第2のレイヤ化画像が、点局所再構築法
に従って復号されるかどうかを示す第2の情報、および前記第1の点局所再構築情報のインデック
スを含む、ことと、
-前記第2の情報が有効になっていることを条件に、
前記第2のメタデータにおける第2の点局所再構築モードを取得することと、
前記3D点群を再構築するために、前記第1の点局所再構築情報に従って前記第2の点局所再構築モードを前記第2のレイヤ化画像に適用することと、を含む、方法。
【請求項2】
-前記データストリームから第3のレイヤ化画像および関連付けられた第3のメタデータを復号することであって、前記第3のメタデータは、前記第3のレイヤ化画像が点局所再構築法
に従って復号されるかどうかを示す第3の情報、および前記第1または前記第2の点局所再構築モード
を示すインデック
スを含む、ことと、
-前記第3の情報が有効になっていることを条件に、
前記第3のメタデータにおける第3の点局所再構築情報を取得することと、
前記3D点群を再構築するために、前記第3の点局所再構築情報に従って前記第1または前記第2の点局所再構築モードを前記第3のレイヤ化画像に適用することと、をさらに含む、請求項1に記載の方法。
【請求項3】
-前記データストリームから第4のレイヤ化画像および関連付けられた第4のメタデータを復号することであって、前記第4のメタデータは、前記第4のレイヤ化画像が点局所再構築法
に従って復号されるかどうかを示す第4の情報、前記第1また
は前記第3の点局所再構築情報のインデックス、および前記第1または前記第2または第3の点局所再構築モード
を示すインデック
スを含む、ことと、
-前記第4の情報が有効になっていることを条件に、
前記3D点群を再構築するために、前記第1また
は前記第3の点局所再構築情報に従って前記第1または前記第2または前記第3の点局所再構築モードを前記第4のレイヤ化画像に適用することと、をさらに含む、請求項2に記載の方法。
【請求項4】
3D点群を復号するデバイスであって、
-データストリームから第1のレイヤ化画像および関連付けられた第1のメタデータを復号することであって、前記第1のメタデータは、前記第1のレイヤ化画像が点局所再構築法に従って復号されるかどうかを示す第1の情報を含む、ことと、
-前記第1の情報が有効になっていることを条件に、
前記第1のメタデータにおける第1の点局所再構築情報および第1の点局所再構築モードを取得することと、
前記第1の点局所再構築モードを、前記第1の点局所再構築情報に従って前記第1のレイヤ化画像に適用して、前記3D点群を再構成することと、
-前記データストリームから第2のレイヤ化画像および関連付けられた第2のメタデータを復号することであって、前記第2のメタデータは、前記第2のレイヤ化画像が点局所再構築法
に従って復号されるかどうかを示す第2の情報、および前記第1の点局所再構築情報のインデック
スを含む、ことと、
-前記第2の情報が有効になっていることを条件に、
前記第2のメタデータにおける第2の点局所再構築モードを取得することと、
前記3D点群を再構築するために、前記第1の点局所再構築情報に従って前記第2の点局所再構築モードを前記第2のレイヤ化画像に適用することと、を行うように構成されたプロセッサを備える、デバイス。
【請求項5】
前記プロセッサが、
-前記データストリームから第3のレイヤ化画像および関連付けられた第3のメタデータを復号することであって、前記第3のメタデータは、前記第3のレイヤ化画像が点局所再構築法
に従って復号されるかどうかを示す第3の情報、および前記第1または前記第2の点局所再構築モード
を示すインデック
スを含む、ことと、
-前記第3の情報が有効になっていることを条件に、
前記第3のメタデータにおける第3の点局所再構築情報を取得することと、
前記3D点群を再構築するために、前記第3の点局所再構築情報に従って前記第1または前記第2の点局所再構築モードを前記第3のレイヤ化画像に適用することと、を行うようにさらに構成されている、請求項4に記載のデバイス。
【請求項6】
前記プロセッサが、
-前記データストリームから第4のレイヤ化画像および関連付けられた第4のメタデータを復号することであって、前記第4のメタデータは、前記第4のレイヤ化画像が点局所再構築法
に従って復号されるかどうかを示す第4の情報、前記第1また
は前記第3の点局所再構築情報のインデックス、および前記第1または前記第2または第3の点局所再構築モード
を示すインデック
スを含む、ことと、
-前記第4の情報が有効になっていることを条件に、
前記3D点群を再構築するために、前記第1また
は前記第3の点局所再構築情報に従って前記第1または前記第2または前記第3の点局所再構築モードを前記第4のレイヤ化画像に適用することと、を行うようにさらに構成されている、請求項5に記載のデバイス。
【請求項7】
3D点群を符号化する方法であって、
-データストリーム内の第1のレイヤ化画像および関連付けられた第1のメタデータを符号化することであって、前記第1のメタデータは、
前記第1のレイヤ化画像が、点局所再構築法に従って復号されるかどうかを示す第1の情報と、
前記第1の情報が有効になっていることを条件に、第1の点局所再構築情報および第1の点局所再構築モードと、を含む、ことと、
-前記データストリーム内の第2のレイヤ化画像および関連付けられた第2のメタデータを符号化することであって、前記第2のメタデータは、
前記第2のレイヤ化画像が、点局所再構築法に従って復号されるかどうかを示す第2の情報と、
前記第1の点局所再構築情報のインデックスと、
前記第2の情報が有効になっていることを条件に、第2の点局所再構築モードと、を含む、ことと、を含む、方法。
【請求項8】
-前記データストリーム内の第3のレイヤ化画像および関連付けられた第3のメタデータを符号化することであって、前記第3のメタデータは、
前記第3のレイヤ化画像が、点局所再構築法に従って復号されるかどうかを示す第3の情報と、
前記第1または前記第2の点局所再構築モード
を示すインデックスと、
前記第3の情報が有効になっていることを条件に、第3の点局所再構築情報と、を含む、こと、をさらに含む、請求項7に記載の方法。
【請求項9】
-前記データストリーム内の第4のレイヤ化画像および関連付けられた第4のメタデータを符号化することであって、前記第4のメタデータは、
前記第4のレイヤ化画像が、点局所再構築法に従って復号されるかどうかを示す第4の情報と、
前記第1また
は前記第3の点局所再構築情報のインデックスと、
前記第1または前記第2または第3の点局所再構築モード
を示すインデックスと、を含む、こと、をさらに含む、請求項8に記載の方法。
【請求項10】
3D点群を符号化するデバイスであって、
-データストリーム内の第1のレイヤ化画像および関連付けられた第1のメタデータを符号化することであって、前記第1のメタデータは、
前記第1のレイヤ化画像が、点局所再構築法に従って復号されるかどうかを示す第1の情報と、
前記第1の情報が有効になっていることを条件に、第1の点局所再構築情報および第1の点局所再構築モードと、を含むことと、
-前記データストリーム内の第2のレイヤ化画像および関連付けられた第2のメタデータを符号化することであって、前記第2のメタデータは、
前記第2のレイヤ化画像が、点局所再構築法に従って復号されるかどうかを示す第2の情報と、
前記第1の点局所再構築情報のインデックスと、
前記第2の情報が有効になっていることを条件に、第2の点局所再構築モードと、を含む、ことと、を行うように構成されたプロセッサを備える、デバイス。
【請求項11】
前記プロセッサが、
-前記データストリーム内の第3のレイヤ化画像および関連付けられた第3のメタデータを符号化することであって、前記第3のメタデータは、
前記第3のレイヤ化画像が、点局所再構築法に従って復号されるかどうかを示す第3の情報と、
前記第1または前記第2の点局所再構築モード
を示すインデックスと、
前記第3の情報が有効になっていることを条件に、第3の点局所再構築情報と、を含む、こと、を行うようにさらに構成されている、請求項10に記載のデバイス。
【請求項12】
前記プロセッサが、
-前記データストリーム内の第4のレイヤ化画像および関連付けられた第4のメタデータを符号化することであって、前記第4のメタデータは、
前記第4のレイヤ化画像が、点局所再構築法に従って復号されるかどうかを示す第4の情報と、
前記第1また
は前記第3の点局所再構築情報のインデックスと、
前記第1または前記第2または第3の点局所再構築モード
を示すインデックスと、を含む、こと、を行うようにさらに構成されている、請求項11に記載のデバイス。
【請求項13】
コンピュータによって実行されたときに、前記コンピュータに、請求項1~3のいずれか一項に記載の方法を実行させる命令を含む、非一時的コンピュータ可読媒体。
【請求項14】
コンピュータによって実行されたときに、前記コンピュータに、請求項7~9のいずれか一項に記載の方法を実行させる命令を含む、非一時的コンピュータ可読媒体。
【発明の詳細な説明】
【技術分野】
【0001】
本実施形態のうちの少なくとも1つは、概して、点群の処理に関する。
【背景技術】
【0002】
本セクションは、技術分野の様々な態様を読者に紹介することを意図しており、これらは以下に説明および/または特許請求される本実施形態のうちの少なくとも1つの様々な態様に関連し得る。本考察は、少なくとも1つの実施形態の様々な態様のより良好な理解を容易にするための背景情報を読者に提供するのに役立つと考えられる。
【0003】
点群は、文化遺産/建築物など、様々な目的に使用することができ、彫像または建築物などのオブジェクトを3Dでスキャンして、そのオブジェクトを送ることまたはそのオブジェクトに訪れることなく、オブジェクトの空間構成を共有する。また、例えば、オブジェクトが破壊される、例えば、地震によって寺院が破壊されることがある場合に、オブジェクトの知識を確実に保存する方式である。このような点群は通常、静的で、色付きで、巨大である。
【0004】
別の使用例は、地形学および地図作成におけるものであり、3D表現を使用することで、地図が平面に限定されず、起伏を含むことができる。現在、Googleマップは、3Dマップの良い例であるが、点群ではなくメッシュを使用している。それでも、点群は3Dマップに好適なデータフォーマットである場合があり、そのような点群は通常、静的で、色付きで、巨大である。
【0005】
自動車産業および自動運転車も、点群を使用することができる領域である。自動運転車は、そのすぐ近くにある現実に基づいて良好な運転判断を行うために、その環境を「探る」ことができて当然である。LIDAR(LIght Detection And Ranging)のような典型的なセンサは、意思決定エンジンで使用される動的な点群を生成する。これらの点群は人間が見ることを意図しておらず、典型的には小さく、必ずしも色付けされておらず、高頻度でキャプチャされるため動的である。これらの点群は、LIDARによって提供される反射率のような他の属性を有し得、この属性は、感知されたオブジェクトの材料についての優れた情報であるため、意思決定に役立つ場合がある。
【0006】
バーチャルリアリティと没入型の世界は最近話題となっており、2Dフラットビデオの未来として多くの人が予測している。基本的な考え方は、視聴者が視聴者の前の仮想世界しか見ることができない標準的なテレビとは対照的に、視聴者を周囲の環境に没頭させることである。環境における視聴者の自由度に応じて、没入感にはいくつかの段階がある。点群は、バーチャルリアリティ(VR)の世界を配信するための優れたフォーマット候補である。
【0007】
多くのアプリケーションでは、許容可能な(または好ましくは非常に良好な)経験の質を維持しつつ、妥当な量のビットレート(またはストレージアプリケーションのストレージスペース)のみを消費することで、動的な点群をエンドユーザに配信(またはサーバに保存)することができることが重要である。これらの動的点群の効率的な圧縮が、没入型世界の配信チェーンを実用的なものにするための要点である。
【0008】
上記を念頭に置いて、少なくとも1つの実施形態が考案されている。
【発明の概要】
【0009】
以下は、本実施形態のいくつかの態様の基本的な理解を提供するために、本実施形態のうちの少なくとも1つの簡略化された概要を提示する。本概要は、一実施形態の広範な大要ではない。一実施形態の主要または重要な要素を特定することは意図していない。以下の概要は、本文書で他の場所で提供されるより詳細な説明への前置きとして、本実施形態のうちの少なくとも1つのいくつかの態様を単純化した形で提示しているにすぎない。
【0010】
少なくとも1つの実施形態の一般的な態様によれば、データストリームからの第1のレイヤ化画像と関連付けられた第1のメタデータを復号することを含む方法が提供される。メタデータは、第1のレイヤ化画像が、点局所再構築法に従って復号されるかどうかを示す第1のフラグを含む。第1のフラグが有効になっている場合、この方法は、該第1のメタデータにおける第1の点局所再構築情報および第1の点局所再構築モードを取得することと、該第1の点局所再構築情報に従って該第1のレイヤ化画像に該第1の点局所再構築モードを適用して、該3D点群を再構築することと、をさらに含む。
【0011】
他の態様によれば、別のレイヤと関連付けられたメタデータからこれらのデータを取得することを可能にするインデックスが現在のレイヤのメタデータに示されている場合、点局所再構築情報および/またはモードはメタデータにおいて省略され得る。
【0012】
別の態様によれば、第2の方法が提供される。この方法は、データストリーム内の第1のレイヤ化画像および関連付けられた第1のメタデータを符号化することを含む。メタデータは、
-第1のレイヤ化画像が、点局所再構築法に従って復号されるかどうかを示す第1のフラグと、
-第1のフラグが有効になっている場合、第1の点局所再構築情報および第1の点局所再構築モードと、を含む。
【0013】
第2の方法の他の態様によれば、別のレイヤと関連付けられたメタデータからこれらのデータを取得することを可能にするインデックスが現在のレイヤのメタデータに示されている場合、点局所再構築情報および/またはモードはメタデータにおいて省略され得る。
【0014】
別の態様によれば、装置が提供される。この装置は、プロセッサを含む。プロセッサは、前述の方法のいずれかを実行することにより、3D点群を符号化または復号するように構成することができる。
【0015】
少なくとも1つの実施形態の別の一般的な態様によれば、説明された符号化の実施形態または変形のいずれかに従って生成されたデータを含む信号が提供される。
【0016】
少なくとも1つの実施形態の別の一般的な態様によれば、ビットストリームは、説明されたコード化の実施形態または変形のいずれかに従って生成されたデータコンテンツを含むようにフォーマットされる。
【0017】
少なくとも1つの実施形態の別の一般的な態様によれば、コンピュータによって実行されると、コンピュータに、説明された復号の実施形態または変形のいずれかを実行させる命令を含むコンピュータプログラム製品が提供される。
【0018】
一般的な態様のこれらおよび他の態様、特徴、および利点は、添付の図面に関連して読まれる例示的な実施形態の以下の詳細な説明から明らかになるであろう。
【図面の簡単な説明】
【0019】
図面には、いくつかの実施形態の例が図示される。図面は以下を示す。
【
図1】本実施形態のうちの少なくとも1つによる2レイヤベースの点群符号化構造の一例の概略ブロック図を示す。
【
図2】本実施形態のうちの少なくとも1つによる2レイヤベースの点群復号構造の一例の概略ブロック図を示す。
【
図3】本実施形態のうちの少なくとも1つによる画像ベースの点群符号化器の例の概略ブロック図を示す。
【
図3a】2つのパッチとそれらの2Dバウンディングボックスを含むキャンバスの例を示す。
【
図4】本実施形態のうちの少なくとも1つによる画像ベースの点群復号器の例の概略ブロック図を示す。
【
図5】本実施形態のうちの少なくとも1つによるベースレイヤBLを表すビットストリームの構文例を概略的に示す。
【
図6】様々な態様および実施形態が実装されるシステムの例のブロック図を示す。
【
図7】本原理に従って3D点群を復号する方法700を図式的に示す。
【
図8】本原理に従って3D点群を符号化する方法800を図式的に示す。
【発明を実施するための形態】
【0020】
本実施形態のうちの少なくとも1つを、本実施形態のうちの少なくとも1つの例が示されている、添付の図を参照して、以下により詳しく説明する。しかしながら、一実施形態は、多くの代替形態で具現化され得、本明細書に記載される例に限定されると解釈されるべきではない。したがって、実施形態を開示された特定の形態に限定する意図はないことを理解されたい。それどころか、本開示は、本出願の趣旨および範囲内に収まるすべての修正、同等物、および代替物を網羅することを意図している。
【0021】
図がフロー図として提示されている場合、それは、対応する装置のブロック図も提供することを理解されたい。同様に、図がブロック図として提示されている場合、それは、対応する方法/プロセスのフロー図も提供することを理解されたい。
【0022】
同様または同一の要素は、同じ参照番号で参照される。
【0023】
一部の図は、V-PCCに準拠するビットストリームの構造を定義するためにV-PCCで広く使用されている構文テーブルを表す。これらの構文テーブルにおいて、「…」という用語は、V-PCCで指定され、読みやすくするために図から削除された元の定義に関して、構文の変更されていない部分を示す。図中の太字の用語は、この用語の値がビットストリームを解析することによって取得されることを示す。構文テーブルの右側の列は、構文要素のデータを符号化するためのビット数を示す。例えば、u(4)は、4ビットがデータの符号化に使用されることを示し、u(8)は、8ビットを示し、ae(v)は、コンテキスト適応型算術エントロピーコード化構文要素を示す。
【0024】
以下に説明および企図される態様は、多くの異なる形式で実装され得る。
図1~15は、以下に、いくつかの実施形態を提供するが、他の実施形態が想定され、
図1~15の考察は、それらの実装形態の間口を限定するものではない。
【0025】
これらの態様のうちの少なくとも1つは、概して、点群符号化および復号に関し、少なくとも1つの他の態様は、概して、生成または符号化されたビットストリームを送信することに関する。
【0026】
より正確には、本明細書で説明する様々な方法および他の態様を使用して、モジュール、例えば、
図3のパッチ情報符号化器3700で行われるものなどのメタデータ符号化に関するモジュール、および
図4のパッチ情報復号器4400、または
図4のジオメトリ生成モジュール4500の再構築プロセスで行われるものなどのメタデータ復号に関するモジュールを変更し得る。
【0027】
さらに、本態様は、点群圧縮に関するMPEG-Iのパート5などのMPEG標準に限定されず、例えば、既存または将来開発されるかどうかにかかわらず、他の標準および勧告、ならびにそのような標準および推奨事項の拡張(MPEG-Iのパート5を含む)に適用され得る。特に指示されない限り、または技術的に除外されていない限り、本出願で説明される態様は、個別にまたは組み合わせて使用され得る。
【0028】
以下では、画像データとは、例えば、特定の画像/ビデオフォーマットの2Dサンプルの1つまたはいくつかのアレイのデータを指す。特定の画像/ビデオフォーマットは、画像(またはビデオ)のピクセル値に関する情報を指定し得る。特定の画像/ビデオフォーマットはまた、例えば、画像(またはビデオ)を視覚化および/または復号するために、ディスプレイおよび/または他の任意の装置によって使用され得る情報を指定し得る。画像は、典型的には、サンプルの第1の2Dアレイの形状の、通常は画像の輝度(luminance)(または輝度(luma))を表す、第1の成分を含む。画像はまた、サンプルの他の2Dアレイの形状の、通常は画像の彩度(chrominance)(または彩度(chroma))を表す、第2の成分および第3の成分を含み得る。いくつかの実施形態は、従来の三色RGB表現などのカラーサンプルの2Dアレイのセットを使用して同じ情報を表す。
【0029】
ピクセル値は、1つ以上の実施形態では、C値のベクトルで表され、ここで、Cは成分の数である。ベクトルの各値は、典型的には、ピクセル値の最大ダイナミックレンジを定義し得るビット数で表される。
【0030】
画像ブロックとは、画像に属するピクセルのセットを意味する。画像ブロック(または画像ブロックデータ)のピクセル値は、この画像ブロックに属するピクセルの値を指す。画像ブロックは、任意の形状にし得るが、長方形が一般的である。
【0031】
点群は、一意の座標を有し、1つ以上の属性を有し得る3Dボリューム空間内の3Dサンプルのデータセットで表し得る。
【0032】
このデータセットの3Dサンプルは、その空間位置(3D空間のX、Y、およびZ座標)によって定義され得、場合によっては、例えばRGBもしくはYUV色空間で表される色、透明度、反射率、2成分の法線ベクトル、またはこのサンプルの特徴を表す任意の特徴などの1つ以上の関連属性によって定義され得る。例えば、3Dサンプルは、6成分点(X,Y,Z,R,G,B)または同等の(X,Y,Z,y,U,V)によって定義され得、式中、(X,Y,Z)は、3D空間における点の座標を定義し、(R,G,B)または(y,U,V)はこの3Dサンプルの色を定義する。同じタイプの属性が複数回存在してもよい。例えば、複数の色属性が、異なる観点からの色情報を提供してもよい。
【0033】
点群は、群が時間に関して変化するか否かに応じて、静的または動的であり得る。静的な点群、または動的な点群のインスタンスは、通常は、点群フレームとして示される。動的な点群の場合、点の数は一般に一定ではなく、むしろ、一般に時間とともに変化する。より一般的には、点群は、例えば、点の数、1つ以上の点の位置、または任意の点の任意の属性など、時間とともに変化するものがある場合、動的であるとみなし得る。
【0034】
例として、2Dサンプルは、6つの成分(u,v,Z,R,G,B)または同等に(u,v,Z,y,U,V)によって定義され得る。(u,v)は、投影面の2D空間における2Dサンプルの座標を定義する。Zは、この投影面に投影された3Dサンプルの深度値である。(R,G,B)または(y,U,V)は、この3Dサンプルの色を定義する。
【0035】
本原理によれば、フラグは、条件が有効になっているかどうかを示すデータストリームに符号化された情報である。例えば、フラグは、データストリームを符号化または復号するときにプロセッサがアクションを実行する必要があるかどうかを示す情報である。別の例では、フラグは、データストリーム内のビットのシーケンスが所与の構文に従っているかどうかを示す情報である。フラグはまた、第2の情報がデータストリーム内で符号化されているかどうかを示す第1の情報であり得る。条件に従っていると、フラグは有効になっていると言う。フラグは、データストリーム内の様々な方法および/またはビットシーケンスによって符号化され得る。
【0036】
図1は、本実施形態のうちの少なくとも1つによる2レイヤベース点群符号化構造1000の例の概略ブロック図を示している。
【0037】
2レイヤベース点群符号化構造1000は、入力点群フレームIPCFを表すビットストリームBを提供し得る。場合によっては、該入力点群フレームIPCFは、動的点群のフレームを表す。次に、該動的点群のフレームは、別のフレームとは独立して、2レイヤベース点群符号化構造1000によって符号化され得る。
【0038】
基本的に、2レイヤベースの点群符号化構造1000は、ビットストリームBをベースレイヤBLおよびエンハンスメントレイヤELとして構造化する能力を提供し得る。ベースレイヤBLは、入力点群フレームIPCFの損失のある表現を提供し得、エンハンスメントレイヤELは、ベースレイヤBLによって表されない孤立点を符号化することによって、より高品質の(場合によっては、損失のない)表現を提供し得る。
【0039】
ベースレイヤBLは、
図3に示されるように、画像ベース符号化器3000によって提供され得る。該画像ベース符号化器3000は、入力点群IPCFの3Dサンプルのジオメトリ/属性を表すジオメトリ/テクスチャ画像を提供し得る。それは、孤立した3Dサンプルを破棄することを可能にし得る。ベースレイヤBLは、
図4に示されるように、画像ベース復号器4000によって復号され得、これは、中間再構築点群フレームIRPCFを提供し得る。
【0040】
次に、
図1の2レイヤベース点群符号化1000に戻ると、比較器COMPは、欠落した/分離された3Dサンプルを検出/位置特定するために、入力点群フレームIPCFの3Dサンプルを中間再構築点群フレームIRPCFの3Dサンプルと比較し得る。次に、符号化器ENCは、欠落した3Dサンプルを符号化し、エンハンスメントレイヤELを提供し得る。最後に、ベースレイヤBLおよびエンハンスメントレイヤELは、ビットストリームBを生成するように、マルチプレクサMUXによって一緒に多重化され得る。
【0041】
一実施形態によれば、符号化器ENCは、中間再構築点群IRPCFの3D基準サンプルRを検出し、欠落した3DサンプルMに関連付け得る検出器を備え得る。
【0042】
例えば、欠落した3DサンプルMと関連付けられた3D基準サンプルRは、所与のメトリックに従ってMの最近傍であり得る。
【0043】
一実施形態によれば、符号化器ENCは、次に、欠落した3DサンプルMの空間位置およびそれらの属性を、該3D基準サンプルRの空間位置および属性に従って決定された差として符号化し得る。
【0044】
変形例において、これらの違いを個別に符号化してもよい。
【0045】
例えば、空間座標がx(M)、y(M)、z(M)の欠落した3DサンプルMの場合、x座標の位置差Dx(M)、y座標の位置差Dy(M)、z座標の位置差Dz(M)、R属性の成分差Dr(M)、G属性の成分差Dg(M)、B属性の成分差Db(M)は、次のように計算され得る:
Dx(M)=x(M)-x(R)
式中、x(M)は、
図3によって提供されるジオメトリ画像における、3DサンプルM、それぞれRのx座標であり、
Dy(M)=y(M)-y(R)
式中、y(M)は、
図3によって提供されるジオメトリ画像における、3DサンプルM、それぞれRのy座標であり、
Dz(M)=z(M)-z(R)
式中、z(M)は、
図3によって提供されるジオメトリ画像における、3DサンプルM、それぞれRのz座標であり、
Dr(M)=R(M)-R(R)
式中、R(M)、それぞれR(R)は、3DサンプルM、それぞれRの色属性のr-color成分であり、
Dg(M)=G(M)-G(R)
式中、G(M)、それぞれG(R)は、3DサンプルM、それぞれRの色属性のg-color成分であり、
Db(M)=B(M)-B(R)
式中、B(M)、それぞれB(R)は、3DサンプルM、それぞれRの色属性のb-color成分である。
【0046】
図2は、本実施形態のうちの少なくとも1つによる2レイヤベース点群復号構造2000の例の概略ブロック図を示している。
【0047】
2レイヤベース点群復号構造2000の動作は、その機能に依存する。
【0048】
機能が制限された2レイヤベース点群復号構造2000は、デマルチプレクサDMUXを使用することにより、ビットストリームBからベースレイヤBLにのみアクセスし得、次いで、
図4に示されるように、点群復号器4000によってベースレイヤBLを復号することによって入力点群フレームIPCFの忠実な(ただし損失のある)バージョンのIRPCFを提供し得る。
【0049】
フル機能を備えた2レイヤベースの点群復号構造2000は、デマルチプレクサDMUXを使用することにより、ビットストリームBからベースレイヤBLとエンハンスメントレイヤELの両方にアクセスし得る。
図4に示されるように、点群復号器4000は、ベースレイヤBLから中間再構築点群フレームIRPCFを決定し得る。復号器DECは、エンハンスメントレイヤELから相補的点群フレームCPCFを決定し得る。次に、コンバイナCOMは、中間再構築点群フレームIRPCFと相補的点群フレームCPCFを結合して、したがって、入力点群フレームIPCFのより高い品質の(場合によっては、損失のない)表現(再構築)CRPCFを提供し得る。
【0050】
図3は、本実施形態のうちの少なくとも1つによる画像ベース点群符号化器3000の例の概略ブロック図を示している。
【0051】
画像ベース点群符号化器3000は、既存のビデオコーデックを利用して、動的点群のジオメトリおよびテクスチャ(属性)情報を圧縮する。これは、基本的に点群データを一連の異なるビデオシーケンスに変換することによって実現される。
【0052】
特定の実施形態では、1つは点群データのジオメトリ情報をキャプチャするためのものであり、もう1つはテクスチャ情報をキャプチャするためのものである、2つのビデオが、既存のビデオコーデックを使用して生成および圧縮され得る。既存のビデオコーデックの例は、HEVCメインプロファイル符号化器/復号器(ITU-T H.265 ITUの電気通信標準化セクタ(02/2018)、シリーズH:オーディオビジュアルおよびマルチメディアシステム、オーディオビジュアルサービスのインフラストラクチャ(動画のコーディング、高効率ビデオコーディング、勧告ITU-T H.265))である。
【0053】
2つのビデオを解釈するために使用される追加のメタデータも、典型的には、別々に生成および圧縮される。そのような追加のメタデータには、例えば、占有マップOMおよび/または補助パッチ情報PIが含まれる。
【0054】
次に、生成されたビデオビットストリームおよびメタデータを一緒に多重化して、結合されたビットストリームを生成し得る。
【0055】
なお、メタデータは典型的には、全体的な情報の少量を表す。情報の大部分はビデオビットストリームにある。
【0056】
このような点群符号化/復号プロセスの例は、ISO/IEC JTC1/SC29/WG11 MPEG2019/w18180(2019年1月、マラケシュ)で定義されているMPEGドラフト標準を実装するテストモデルカテゴリ2アルゴリズム(V-PCCとも呼ばれる)によって与えられる。
【0057】
ステップ3100において、モジュールPGMは、最良の圧縮を提供する戦略を使用して、入力点群IPCFを表すデータセットの3Dサンプルを投影面上の2Dサンプルに分解することによって、少なくとも1つのパッチを生成し得る。
【0058】
パッチは、2Dサンプルのセットとして定義され得る。
【0059】
例えば、V-PCCでは、例えば、Hoppeら(Hugues Hoppe、Tony DeRose、Tom Duchamp、John McDonald、Werner Stuetzle。Surface reconstruction from unorganized points.ACM SIGGRAPH 1992 Proceedings、71-78)で説明されているように、すべての3Dサンプルの法線が最初に推定される。次に、各3Dサンプルを、入力点群フレームIPCFの3Dサンプルを包含する3Dバウンディングボックスの6つの配向された平面のうちの1つと関連付けることによって、入力点群フレームIPCFの初期クラスタリングを取得する。より正確には、各3Dサンプルをクラスタ化し、最も近い法線を有する(つまり、点法線と平面法線とのドット積を最大化する)配向された平面と関連付けられる。次に、3Dサンプルを、それらの関連付けられた平面に投影する。それらの平面内に連結領域を形成する3Dサンプルのセットを、連結成分と称する。連結成分は、同様の法線と同じ関連付けられた配向された平面を有する少なくとも1つの3Dサンプルのセットである。次に、各3Dサンプルと関連付けられたクラスタを、その法線およびその最も近い隣接サンプルのクラスタに基づいて繰り返し更新することによって、初期クラスタリングを洗練する。最後のステップは、各連結成分から1つのパッチを生成することで構成され、これは、各連結成分の3Dサンプルを、該連結成分と関連付けられた配向された平面に投影することによって行われる。パッチは、ジオメトリおよび/または属性情報に対応する投影された2Dサンプルを解釈するために、各パッチに対して定義された補助パッチ情報を表す補助パッチ情報PIと関連付けられる。
【0060】
例えば、V-PCCでは、補助パッチ情報PIには、1)連結成分の3Dサンプルを包含する3Dバウンディングボックスの6つの配向された平面のうちの1つを示す情報、2)平面法線に関する情報、3)深度、接線(tangential)シフト、および双接(bi-tangential)シフトの観点から表されたパッチに関する連結成分の3D位置を決定する情報、ならびに4)パッチを包含する2Dバウンディングボックスを定義する投影面の座標(u0,v0,u1,v1)などの情報、が含まれる。
【0061】
ステップ3200において、パッチパッキングモジュールPPMは、典型的には未使用のスペースを最小限に抑える方法で、オーバーラップすることなく、少なくとも1つの生成されたパッチを2Dグリッド(キャンバスとも呼ばれる)にマッピング(配置)し得、2DグリッドのすべてのT×T(例えば、16×16)ブロックが一意のパッチと関連付けられることを保証し得る。2Dグリッドの所与の最小ブロックサイズT×Tは、この2Dグリッドに配置された個別のパッチ間の最小距離を指定し得る。2Dグリッドの解像度は、入力点群のサイズとその幅Wおよび高さHに依存し得、ブロックサイズTは、メタデータとして復号器に送信され得る。
【0062】
補助パッチ情報PIは、2Dグリッドのブロックとパッチとの間の関連付けに関する情報をさらに含み得る。
【0063】
V-PCCでは、補助情報PIには、2Dグリッドのブロックとパッチインデックスとの間の関連付けを決定するパッチインデックス情報(BlockToPatch)へのブロックを含み得る。
【0064】
図3aは、2つのパッチP1およびP2とそれらの関連付けられた2DバウンディングボックスB1およびB2とを含むキャンバスCの例を示している。なお、
図3aに示されているように、2つのバウンディングボックスがキャンバスC内で重なり合い得る。2Dグリッド(キャンバスの分割)は、バウンディングボックスの内側でのみ表されるが、キャンバスの分割は、これらのバウンディングボックスの外側でも発生する。パッチと関連付けられたバウンディングボックスは、T×Tブロック(典型的にはT=16)に分割することができる。
【0065】
パッチに属する2Dサンプルを含むT×Tブロックは、対応する占有マップOMで占有ブロックとみなし得る。占有マップOMのブロックは、ブロックが占有されているかどうか、すなわち、パッチに属する2Dサンプルが含まれているかどうかを示し得る。
【0066】
図3aでは、占有ブロックは、白いブロックによって表され、薄い灰色のブロックは、非占有ブロックを表す。画像生成プロセス(ステップ3300および3400)は、ステップ3200の間に演算された2Dグリッドへの少なくとも1つの生成されたパッチのマッピングを利用して、入力点群フレームIPCFのジオメトリおよびテクスチャを画像として格納する。
【0067】
ステップ3300において、ジオメトリ画像生成器GIGは、入力点群IPCF、占有マップOM、および補助パッチ情報PIから少なくとも1つのジオメトリ画像GIを生成し得る。ジオメトリ画像生成器GIGは、占有ブロック、したがってジオメトリ画像GI内の空でないピクセルを検出(位置特定)するために、占有マップ情報を利用し得る。
【0068】
ジオメトリ画像GIは、入力点群フレームIPCFのジオメトリを表し得、例えば、YUV420-8ビットフォーマットで表されるW×Hピクセルの単色画像であり得る。
【0069】
複数の3Dサンプルが(同じ投影方向(線)に沿って)投影面の同じ2Dサンプルに投影(マッピング)される場合をより適切に処理するために、レイヤと称される複数の画像を生成し得る。したがって、異なる深度値D1、…、Dnは、パッチの2Dサンプルと関連付けられ得、次いで、複数のジオメトリ画像を生成し得る。
【0070】
V-PCCでは、パッチの2Dサンプルが2つのレイヤに投影される。ニアレイヤとも呼ばれる第の1のレイヤは、例えば、より小さな深度の2Dサンプルと関連付けられた深度値D0を格納し得る。ファーレイヤと呼ばれる第2のレイヤは、例えば、より大きな深度の2Dサンプルと関連付けられた深度値D1を格納し得る。あるいは、第2のレイヤは、深度値D1とD0の間の差の値を格納し得る。例えば、第2の深度画像によって格納される情報は、範囲[D0,D0+Δ]の深度値に対応する間隔[0,Δ]内にあり得、Δは、表面の厚さを記述するユーザ定義のパラメータである。
【0071】
このようにして、第2のレイヤには、輪郭のような重要な高周波数特徴が含まれ得る。したがって、従来のビデオコーダを使用して第2の深度画像を符号化することは困難であり、したがって、深度値は、該復号された第2の深度画像から不十分に再構築され得、その結果、再構築された点群フレームのジオメトリが低品質となる。
【0072】
一実施形態によれば、ジオメトリ画像生成モジュールGIGは、補助パッチ情報PIを使用することによって、第1および第2のレイヤの2Dサンプルと関連付けられた深度値をコード化(導出)し得る。
【0073】
V-PCCでは、対応する連結成分を有するパッチ内の3Dサンプルの位置は、次のように、深度δ(u,v)、接線シフトs(u,v)、および双接シフトr(u,v)の観点で表現され得る:
δ(u,v)=δ0+g(u,v)
s(u,v)=s0-u0+u
r(u,v)=r0-v0+v
式中、g(u,v)は、ジオメトリ画像の輝度成分であり、(u,v)は、投影面上の3Dサンプルと関連付けられたピクセルであり、(δ0,s0,r0)は、3Dサンプルが属する連結成分の対応するパッチの3D位置であり、(u0,v0,u1,v1)は、該連結成分と関連付けられたパッチの投影を包含する2Dバウンディングボックスを定義する該投影面内の座標である。
【0074】
したがって、ジオメトリ画像生成モジュールGIGは、レイヤの2Dサンプル(第1または第2、あるいはその両方)と関連付けられた深度値を、g(u,v)=δ(u,v)-δ0で与えられる輝度成分g(u,v)としてコード化(導出)し得る。なお、この関係は、付随する補助パッチ情報PIを伴う再構築されたジオメトリ画像g(u,v)から3Dサンプル位置(δ0,s0,r0)を再構築するために使用され得る。
【0075】
一実施形態によれば、投影モードを使用して、第1のジオメトリ画像GI0が第1または第2のレイヤのいずれかの2Dサンプルの深度値を格納し得、第2のジオメトリ画像GI1が第1または第2のレイヤのいずれかの2Dサンプルと関連付けられた深度値を格納し得るかどうかを示し得る。
【0076】
例えば、投影モードが0に等しい場合、第1のジオメトリ画像GI0は、第1のレイヤの2Dサンプルの深度値を格納し得、第2のジオメトリ画像GI1は、第2のレイヤの2Dサンプルと関連付けられた深度値を格納し得る。逆に、投影モードが1に等しい場合、第1のジオメトリ画像GI0は、第2のレイヤの2Dサンプルの深度値を格納し得、第2のジオメトリ画像GI1は、第1のレイヤの2Dサンプルと関連付けられた深度値を格納し得る。
【0077】
一実施形態によれば、フレーム投影モードを使用して、固定投影モードがすべてのパッチに使用されるかどうか、または各パッチが異なる投影モードを使用し得る可変投影モードが使用されるかどうかを示し得る。
【0078】
投影モードおよび/またはフレーム投影モードは、メタデータとして送信され得る。
【0079】
フレーム投影モード決定アルゴリズムは、例えば、V-PCCのセクション2.2.1.3.1で提供され得る。
【0080】
一実施形態によれば、フレーム投影が可変投影モードを使用し得ることを示す場合、パッチ投影モードを使用して、パッチを投影(投影解除)するために使用する適切なモードを示し得る。
【0081】
パッチ投影モードは、メタデータとして送信し得、場合によっては、補助パッチ情報PIに含まれる情報であってもよい。
【0082】
パッチ投影モード決定アルゴリズムは、例えばV-PCCのセクション2.2.1.3.2で提供される。
【0083】
ステップ3300の実施形態によれば、第1のジオメトリ画像、例えば、パッチの2Dサンプル(u,v)に対応するGI0のピクセル値は、該2Dサンプル(u,v)に対応する投影線に沿って定義された少なくとも1つの中間3Dサンプルと関連付けられた深度値を表し得る。該中間3Dサンプルは、投影線に沿って存在し、深度値D1が第2のジオメトリ画像、例えばGI1にコード化されている2Dサンプル(u,v)の同じ座標を共有する。また、該中間3Dサンプルは、深度値D0と深度値D1との間の深度値を有し得る。指定されたビットは、中間3Dサンプルの各々と関連付けることができ、中間3Dサンプルが存在する場合は1に設定され、そうでない場合は0に設定される。
【0084】
次に、該投影線に沿った該指定されたすべてのビットを連結して、以下、拡張デルタ深度(EDD)コードと呼ばれるコードワードを形成することができる。最後に、すべてのEDDコードを、例えば第1のジオメトリ画像GI1または占有マップOMなどの画像にパッキングすることができる。
【0085】
ステップ3400において、テクスチャ画像発生器TIGは、入力点群フレームIPCF、占有マップOM、補助パッチ情報PI、および、ビデオ復号器VDECの出力(
図4のステップ4200)である少なくとも1つの復号されたジオメトリ画像DGIから導出された再構築点群フレームのジオメトリから少なくとも1つのテクスチャ画像TIを生成し得る。
【0086】
テクスチャ画像TIは、入力点群フレームIPCFのテクスチャを表し得、例えば、YUV420-8ビットフォーマットで表されるW×Hピクセルの画像であり得る。
【0087】
テクスチャ画像生成器TGは、占有ブロック、したがってテクスチャ画像内の空でないピクセルを検出(位置特定)するために、占有マップ情報を利用し得る。
【0088】
テクスチャ画像生成器TIGは、テクスチャ画像TIを生成し、各ジオメトリ画像/レイヤDGIと関連付けるように適合させ得る。
【0089】
一実施形態によれば、テクスチャ画像生成器TIGは、第1のレイヤの2Dサンプルと関連付けられたテクスチャ(属性)値T0を、第1のテクスチャ画像TI0のピクセル値としてコード化(格納)し得、第2のレイヤの2Dサンプルと関連付けられたテクスチャ値T1を、第2のテクスチャ画像TI1のピクセル値としてコード化(格納)し得る。
【0090】
あるいは、テクスチャ画像生成モジュールTIGは、第2のレイヤの2Dサンプルと関連付けられたテクスチャ値T1を、第1のテクスチャ画像TI0のピクセル値としてコード化(格納)し得、第1のレイヤの2Dサンプルと関連付けられたテクスチャ値D0を、第2のジオメトリ画像GI1のピクセル値としてコード化(格納)し得る。
【0091】
例えば、3Dサンプルの色は、V-PCCのセクション2.2.3、2.2.4、2.2.5、2.2.8、または2.5で説明されているように取得され得る。
【0092】
一実施形態によれば、パディングプロセスを、ジオメトリおよび/またはテクスチャ画像に適用してもよい。パディングプロセスを使用して、パッチ間の空きスペースを埋め、ビデオ圧縮に適した区分的に滑らかな画像を生成することができる。
【0093】
画像パディングの例は、V-PCCのセクション2.2.6および2.2.7で提供される。
【0094】
ステップ3500において、ビデオ符号化器VENCは、生成された画像/レイヤTIおよびGIを符号化し得る。
【0095】
ステップ3600において、符号化器OMENCは、例えば、V-PCCのセクション2.2.2に詳述されるように、占有マップを画像として符号化し得る。損失のあるまたは損失のない符号化を使用し得る。
【0096】
一実施形態によれば、ビデオ符号化器ENCおよび/またはOMENCは、HEVCベース符号化器であり得る。
【0097】
ステップ3700において、符号化器PIENCは、補助パッチ情報PI、および場合によっては、ジオメトリ/テクスチャ画像のブロックサイズT、幅Wおよび高さHなどの追加のメタデータを符号化し得る。
【0098】
一実施形態によれば、補助パッチ情報は、(例えば、V-PCCのセクション2.4.1で定義されるように)示差的に符号化され得る。
【0099】
ステップ3800において、マルチプレクサは、ステップ3500、3600、および3700の生成された出力に適用され得、その結果、これらの出力は、ベースレイヤBLを表すビットストリームを生成するように一緒に多重化され得る。なお、メタデータ情報は、ビットストリーム全体のごく一部を表す。情報の大部分は、ビデオコーデックを使用して圧縮される。
【0100】
図4は、本実施形態のうちの少なくとも1つによる画像ベース点群復号器4000の例の概略ブロック図を示している。
【0101】
ステップ4100において、デマルチプレクサDMUXは、ベースレイヤBLを表すビットストリームの符号化された情報を逆多重化するために適用され得る。
【0102】
ステップ4200において、ビデオ復号器VDECは、符号化された情報を復号して、少なくとも1つの復号されたジオメトリ画像DGIおよび少なくとも1つの復号されたテクスチャ画像DTIを導出し得る。
【0103】
ステップ4300において、復号器OMDECは、符号化された情報を復号して、復号された占有マップDOMを導出し得る。
【0104】
一実施形態によれば、ビデオ復号器VDECおよび/またはOMDECは、HEVCベース復号器であり得る。
【0105】
ステップ4400において、復号器PIDECは、符号化された情報を復号して、補助パッチ情報DPIを導出し得る。
【0106】
場合によっては、メタデータはまた、ビットストリームBLから導出され得る。
【0107】
ステップ4500において、ジオメトリ生成モジュールGGMは、少なくとも1つの復号されたジオメトリ画像DGI、復号された占有マップDOM、復号された補助パッチ情報DPI、および可能な追加のメタデータから、再構築された点群フレームIRPCFのジオメトリRGを導出し得る。
【0108】
ジオメトリ生成モジュールGGMは、少なくとも1つの復号されたジオメトリ画像DGI内の空でないピクセルを位置特定するために、復号された占有マップ情報DOMを利用し得る。次に、空でないピクセルと関連付けられた再構築3Dサンプルの3D座標は、該空でないピクセルの座標および該再構築2Dサンプルの値から導出され得る。
【0109】
一実施形態によれば、ジオメトリ生成モジュールGGMは、空でないピクセルの座標から再構築3Dサンプルの3D座標を導出し得る。
【0110】
一実施形態によれば、ジオメトリ生成モジュールGGMは、空でないピクセルの座標、少なくとも1つの復号されたジオメトリ画像DGIのうちの1つの該空でないピクセルの値、復号された補助パッチ情報、および場合によっては追加のメタデータから、再構築3Dサンプルの3D座標を導出し得る。
【0111】
空でないピクセルの使用は、3Dサンプルとの2Dピクセルの関係に基づく。例えば、V-PCCでの該投影では、再構築3Dサンプルの3D座標は、次のように、深度δ(u,v)、接線シフトs(u,v)、および双接シフトr(u,v)の観点で表現され得る:
δ(u,v)=δ0+g(u,v)
s(u,v)=s0-u0+u
r(u,v)=r0-v0+v
式中、g(u,v)は、復号されたジオメトリ画像DGIの輝度成分、(u,v)は、再構築3Dサンプルと関連付けられたピクセルであり、(δ0,s0,r0)は、再構築3Dサンプルが属する連結成分の3D位置であり、(u0,v0,u1,v1)は、該連結成分と関連付けられたパッチの投影を包含する2Dバウンディングボックスを定義する投影面内の座標である。
【0112】
ステップ4600において、テクスチャ生成モジュールTGMは、再構築点群フレームIRPCFのテクスチャを、ジオメトリRGおよび少なくとも1つの復号されたテクスチャ画像DTIから導出し得る。
【0113】
図5は、本実施形態のうちの少なくとも1つによる、ベースレイヤBLを表すビットストリームの例示的な構文を概略的に示している。
【0114】
ビットストリームは、ビットストリームヘッダSHおよび少なくとも1つのフレームストリームGOFSのグループを含む。
【0115】
フレームストリームGOFSのグループは、ヘッダHS、占有マップOMを表す少なくとも1つの構文要素OMS、少なくとも1つのジオメトリ画像(またはビデオ)を表す少なくとも1つの構文要素GVS、少なくとも1つのテクスチャ画像(またはビデオ)を表す少なくとも1つの構文要素TVS、および補助パッチ情報および他の追加メタデータを表す少なくとも1つの構文要素PISを含む。
【0116】
変形例では、フレームストリームGOFSのグループは、少なくとも1つのフレームストリームを含む。
【0117】
図6は、様々な態様および実施形態が実装されるシステムの例を示す概略ブロック図を示している。
【0118】
システム6000は、以下で説明される様々な構成要素を含む1つ以上のデバイスとして具体化することができ、本文書で説明される態様のうちの1つ以上を行うように構成される。システム6000の全部または一部を形成し得る機器の例には、パーソナルコンピュータ、ラップトップ、スマートフォン、タブレットコンピュータ、デジタルマルチメディアセットトップボックス、デジタルテレビ受信機、パーソナルビデオ録画システム、接続された家電製品、接続された車両およびそれらの関連付けられた処理システム、ヘッドマウントディスプレイデバイス(HMD、シースルーグラス)、プロジェクタ(ビーマー)、「Cave」(複数のディスプレイを含むシステム)、サーバ、ビデオ符号化器、ビデオ復号器、ビデオ復号器からの出力を処理するポストプロセッサ、ビデオ符号化器への入力を提供するプリプロセッサ、Webサーバ、セットトップボックス、ならびに点群、ビデオ、画像、または他の通信デバイスを処理するための他のデバイス、が含まれる。システム6000の要素は、単独でも組み合わせでも、単一の集積回路、複数のIC、および/または別個の構成要素に具体化され得る。例えば、少なくとも1つの実施形態では、システム6000の処理および符号化器/復号器要素は、複数のICおよび/または個別の構成要素にわたって分散し得る。様々な実施形態では、システム6000は、他の同様のシステムに、または他の電子デバイスに、例えば、通信バスを介して、または専用の入力および/もしくは出力ポートを通して、通信可能に結合され得る。様々な実施形態では、システム6000は、本文書で説明される態様のうちの1つ以上を実装するように構成され得る。
【0119】
システム6000は、例えば、本文書に説明される様々な態様を実装するために、読み込まれた命令を実行するように構成された少なくとも1つのプロセッサ6010を含み得る。プロセッサ6010は、埋め込みメモリ、入力出力インターフェース、および当該技術分野において知られているような他の様々な回路を含み得る。システム6000は、少なくとも1つのメモリ6020(例えば、揮発性メモリデバイス、および/または不揮発性メモリデバイス)を含み得る。システム6000は、不揮発性メモリおよび/または揮発性メモリを含み得るストレージデバイス6040を含み得、これらに限定しないが、電気的に消去可能なプログラム可能な読み取り専用メモリ(EEPROM)、読み取り専用メモリ(ROM)、プログラム可能な読み取り専用メモリ(PROM)、ランダムアクセスメモリ(RAM)、ダイナミックランダムアクセスメモリ(DRAM)、スタティックランダムアクセスメモリ(SRAM)、フラッシュ、磁気ディスクドライブ、および/または光ディスクドライブが挙げられる。ストレージデバイス6040は、非限定的な例として、内部ストレージデバイス、付属ストレージデバイス、および/またはネットワークアクセス可能ストレージデバイスを含み得る。
【0120】
システム6000は、例えば、符号化されたデータまたは復号されたデータを提供するためにデータを処理するように構成された符号化器/復号器モジュール6030を含み得、符号化器/復号器モジュール6030は、独自のプロセッサおよびメモリを含み得る。符号化器/復号器モジュール6030は、符号化および/または復号機能を実行するデバイスに含まれ得るモジュールを表し得る。既知であるように、デバイスは、符号化モジュールおよび復号モジュールの一方または両方を含むことができる。さらに、符号化器/復号器モジュール6030は、システム6000の別個の要素として実装されてもよく、または、当業者に知られているハードウェアとソフトウェアとの組み合わせとしてプロセッサ6010内に組み込まれてもよい。
【0121】
本文書に説明される様々な態様を実行するようにプロセッサ6010または符号化器/復号器6030にロードされることになるプログラムコードは、ストレージデバイス6040に記憶され、続いて、プロセッサ6010による実行のためにメモリ6020上にロードされ得る。様々な実施形態によれば、プロセッサ6010、メモリ6020、ストレージデバイス6040、および符号化器/復号器モジュール6030のうちの1つ以上は、本文書に説明される処理の実行中、様々な項目のうちの1つ以上を格納し得る。そのような格納される項目には、これらに限定されるものではないが、点群フレーム、符号化/復号されたジオメトリ/テクスチャビデオ/画像もしくは符号化/復号されたジオメトリ/テクスチャビデオ/画像の一部、ビットストリーム、行列、変数、ならびに等式、式、演算、および演算ロジックの処理からの中間結果または最終結果が含まれ得る。
【0122】
いくつかの実施形態では、プロセッサ6010および/または符号化器/復号器モジュール6030内のメモリを、命令を格納し、符号化または復号中に行われ得る処理のためのワーキングメモリを提供するために使用し得る。
【0123】
しかしながら、他の実施形態では、処理デバイス(例えば、処理デバイスは、プロセッサ6010または符号化器/復号器モジュール6030のいずれかであり得る)の外部のメモリを、これらの機能のうちの1つ以上のために使用し得る。外部メモリは、メモリ6020および/またはストレージデバイス6040であり得、例えば、ダイナミック揮発性メモリおよび/または不揮発性フラッシュメモリであり得る。いくつかの実施形態では、テレビのオペレーティングシステムを格納するために外部不揮発性フラッシュメモリを使用し得る。少なくとも1つの実施形態では、RAMなどの高速外部動的揮発性メモリを、MPEG-2パート2(ITU-T勧告H.262およびISO/IEC13818-2としても知られ、MPEG-2ビデオとしても知られている)、HEVC(高効率ビデオコーディング)、またはVVC(多用途ビデオコーディング)などのビデオ符号化および復号動作のためのワーキングメモリとして使用し得る。
【0124】
システム6000の要素への入力は、ブロック6130に示されるような様々な入力デバイスを通って提供され得る。そのような入力デバイスには、これらに限定されるものではないが、(i)例えば、ブロードキャスタによって無線を介して送信されたRF信号を受信し得るRF部、(ii)コンポジット入力端子、(iii)USB入力端子、および/または(iv)HDMI入力端子が含まれる。
【0125】
様々な実施形態では、ブロック6130の入力デバイスは、当技術分野で知られているような関連付けられたそれぞれの入力処理要素を有し得る。例えば、RF部は、(i)所望の周波数を選択すること(信号を選択すること、またはある周波数帯域に信号を帯域制限すること、とも称される)、(ii)選択された信号をダウンコンバートすること、(iii)(例えば)ある特定の実施形態ではチャネルと称され得る信号周波数帯域を選択(例えば)するために、より狭い周波数帯域に再び帯域制限すること、(iv)ダウンコンバートされ、かつ帯域制限された信号を復調すること、(v)エラー訂正を実施すること、および(vi)逆多重化して、所望のデータパケットストリームを選択すること、のために必要な要素と関連付けられ得る。様々な実施形態のRF部には、これらの機能を実行する1つ以上の要素、例えば、周波数セレクタ、信号セレクタ、帯域リミッタ、チャネルセレクタ、フィルタ、ダウンコンバータ、復調器、誤り訂正器、およびデマルチプレクサが含まれ得る。RF部には、例えば、受信した信号をより低い周波数に(例えば、中間周波数またはベースバンドに近い周波数)、またはベースバンドにダウンコンバートすることを含む、様々なこれらの機能を実行するチューナが含まれ得る。
【0126】
1つのセットトップボックスの実施形態では、RF部およびその関連付けられた入力処理要素は、有線(例えば、ケーブル)媒体を介して送信されたRF信号を受信し得る。次に、RF部分は、フィルタリング、ダウンコンバート、および所望の周波数帯域への再フィルタリングによって周波数選択を実行し得る。
【0127】
様々な実施形態では、上記(および他の)要素の順番が並べ替えられ、これらの要素のうちのいくつかが取り除かれ、かつ/または同様もしくは異なる機能を実行する他の要素が追加される。
【0128】
要素を追加することには、既存の要素間に要素を挿入すること、例えば、増幅器およびアナログ-デジタル変換器を挿入することなどが含まれ得る。様々な実施形態では、RF部には、アンテナが含まれ得る。
【0129】
さらに、USBおよび/またはHDMI端子は、USBおよび/またはHDMI接続にわたって他の電子デバイスにシステム6000を接続するためのそれぞれのインターフェースプロセッサを含み得る。入力処理の様々な態様、例えば、リード・ソロモン誤り訂正を、例えば、必要に応じて、別個の入力処理IC内またはプロセッサ6010内に実装し得ることを理解されたい。同様に、USBまたはHDMIインターフェース処理の態様を、必要に応じて、別個のインターフェースIC内またはプロセッサ6010内に実装し得る。例えば、出力デバイス上での表示のために、必要に応じて、データストリームを処理するように、メモリおよびストレージ要素と組み合わせて動作する、プロセッサ6010、および符号化器/復号器6030を含む、様々な処理要素に対して、復調され、エラー訂正され、かつ逆多重化されたストリームを提供し得る。
【0130】
システム6000の様々な要素は、一体型ハウジング内に設けられ得る。一体型ハウジング内で、様々な要素は、相互接続され、好適な接続配置6140、例えば、I2Cバス、配線、およびプリント回路基板を含む当技術分野で知られている内部バスを使用して、それらの間でデータを送信し得る。
【0131】
システム6000は、通信チャネル6060を介して他のデバイスとの通信を可能にする通信インターフェース6050を含み得る。通信インターフェース6050は、これに限定されるものではないが、通信チャネル6060を介してデータを送受信するように構成されたトランシーバを含み得る。通信インターフェース6050は、これらに限定されるものではないが、モデムまたはネットワークカードを含み得、通信チャネル6060は、例えば、有線および/または無線媒体内に実装され得る。
【0132】
様々な実施形態では、データは、IEEE802.11などのWi-Fiネットワークを使用して、システム6000にストリーミングされ得る。これらの実施形態のWi-Fi信号は、Wi-Fi通信に適合された通信チャネル6060および通信インターフェース6050を介して受信され得る。これらの実施形態の通信チャネル6060は、ストリーミングアプリケーションおよび他のオーバー・ザ・トップ通信を可能にするインターネットを含む外部ネットワークへのアクセスを提供するアクセス点またはルータに典型的には接続され得る。
【0133】
他の実施形態は、入力ブロック6130のHDMI接続を介してデータを配信するセットトップボックスを使用して、ストリーミングされたデータをシステム6000に提供し得る。
【0134】
さらに他の実施形態は、入力ブロック6130のRF接続を使用して、ストリーミングされたデータをシステム6000に提供し得る。
【0135】
信号伝達は、様々な方式で達成され得ることが分かるはずである。例えば、1つ以上の構文要素、フラグなどが、様々な実施形態で、対応する復号器に情報を信号伝達するために使用され得る。
【0136】
システム6000は、ディスプレイ6100、スピーカ6110、および他の周辺デバイス6120を含む、様々な出力デバイスに出力信号を提供し得る。他の周辺デバイス6120には、実施形態の様々な例では、スタンドアローンDVR、ディスクプレーヤ、ステレオシステム、照明システム、およびシステム3000の出力に基づいて機能を提供する他のデバイスのうちの1つ以上が含まれ得る。
【0137】
様々な実施形態では、システム6000と、ディスプレイ6100、スピーカ6110、または他の周辺デバイス6120との間で、AV Link(オーディオ/ビデオリンク)、CEC(コンシューマエレクトロニクス制御)、またはユーザの介入の有無にかかわらず、デバイス間制御を可能にする他の通信プロトコルなどの信号伝達を使用して、制御信号が通信され得る。
【0138】
出力デバイスは、それぞれのインターフェース6070、6080、および6090による専用接続を介してシステム6000に通信可能に結合され得る。
【0139】
あるいは、出力デバイスは、通信インターフェース6050を介して、通信チャネル6060を使用してシステム6000に接続され得る。ディスプレイ6100およびスピーカ6110は、例えば、テレビなどの電子デバイス内のシステム6000の他の構成要素と、単一のユニット内に統合され得る。
【0140】
様々な実施形態では、ディスプレイインタフェース6070は、例えば、タイミングコントローラ(T Con)チップなどのディスプレイドライバを含み得る。
【0141】
ディスプレイ6100およびスピーカ6110は、例えば、入力6130のRF部が別個のセットトップボックスの一部である場合、他の構成要素のうちの1つ以上から代替的に分離され得る。ディスプレイ6100およびスピーカ6110が外部構成要素であり得る様々な実施形態では、例えば、HDMIポート、USBポート、またはCOMP出力を含む、専用出力接続を介して出力信号を提供し得る。
【0142】
PLRは、Point Local Reconstructionの略である。PLRは、点群フレームに追加の3Dサンプルを生成するために使用し得る再構築法である。PLRは、典型的には、2Dから3Dへの投影の直後、例えば、ジオメトリまたはテクスチャのスムージングなどの他の処理の前に適用される。
【0143】
PLRは、3Dサンプルのレイヤを入力として受け取り、PLRメタデータによって駆動される一連のフィルタを適用して、ジオメトリとテクスチャを含む追加の3Dサンプルを生成する。
【0144】
PLRメタデータは、キャンバスのT×Tブロックごとに変更され得、フィルタのセットは、小さい近傍を使用して追加の3Dサンプルを生成し得るので、PLRは、局所的であり得る。なお、符号化器と復号器とで同じPLRメタデータを使用する必要がある。
【0145】
典型的な条件では、PLRで深度とテクスチャの画像を1レイヤ使用すると、深度とテクスチャの画像を2レイヤにするよりもBDレートのパフォーマンスが向上する。PLRメタデータのコーディングは、深度とテクスチャの画像への投影による3Dサンプルの従来のコーディングよりも少ないビットで済むため、全体的なビットレートは低下する。同時に、追加の3Dサンプルは、使用するレイヤの数が少ないために発生する品質の低下を補う。
【0146】
V-PCCには、PLRの実装が含まれ、PLRは、符号化器側でRDO(レート歪み最適化)によって決定される。該PLRの実装は、点群フレームのうちの少なくとも1つの3Dサンプルを再構築(生成)するために、PLRM(点局所再構築モード)と呼ばれる複数のモードを定義する。各PLRMは、フィルタの使用方法を定義したPLRMメタデータの特定の値によって決定される。
【0147】
例えば、V-PCCのセクション「9.4.4」では、複数のPLRMは、V-PCCのセクション「7.4.35点局所再構築セマンティクス」で説明されている4つのパラメータによって決定される。該4つのパラメータは、以下のビットストリームでPLRMメタデータとして送信される。
●point_local_reconstruction_mode_interpolate_flag:
このパラメータは、1に等しく、再構築法の間に点補間が使用されることを示し、このパラメータは、0に等しく、再構築法の間に点補間が使用されないことを示す。
●point_local_reconstruction_mode_filling_flag
このパラメータは、1に等しく、再構築法の間に充填モードが使用されることを示し、このパラメータは、0に等しく、再構築プロセスの間に充填モードが使用されないことを示す。
●point_local_reconstruction_mode_minimum_depth_minus1:
このパラメータは、再構築法の間に使用する最小深度値から1を引いたものを指定する。
●point_local_reconstruction_mode_neighbour_minus1:
このパラメータは、再構築法で使用する2D近傍のサイズから1を引いたものを指定する。
【0148】
PLRをコーディングするための構文は、ドキュメントw18479で定義されているV-PCCのセクション「7.3.4.1」で詳しく説明されている。この構文は、T×Tブロック(占有パッキングブロックサイズ)によって「blockToPatch」情報を介して、またはパッチによって送信されるPLRMメタデータを記述する。blockToPatch構造は、T×Tピクセルのブロックごとに、それが属するパッチを示す。ブロックからパッチへのブロックの16×16ピクセルのサイズは、V-PCCテストのモデルソフトウェアで使用される典型的な値である。仕様(および本実施形態のうちの少なくとも1つ)は、ブロックからパッチへのインデックスおよびPLRMメタデータのための他のブロックサイズをサポートし得る。
【0149】
本原理によれば、符号化器は、PLRモードが関連付けられたいくつかのレイヤを生成することが可能である。レイヤの概念により、これらすべての3D点を効率的にキャプチャすることが可能になり、PLR法では、このような投影を符号化するために必要なビットレートを削減することが可能になる。現在のテストモデルは、最大2つのレイヤをサポートする。2レイヤモードでPLRを使用する可能性を加えると、点群の圧縮効率が向上し、再構築点群を元の点群により忠実に保つことができる。
【0150】
PLRメタデータが関連付けられたレイヤかどうかに関係なく、複数のレイヤを符号化および復号するための構文および方法は存在しない。PLR情報および/またはモードを異なるレイヤ化画像に関連付けるための信号伝達方法はない。例えば、V-PCC規格のドキュメントw18479で説明されているように既存の構文を変更することは、任意の変更がシステム全体の適応をもたらすことを暗に意味するため、簡単ではない。さらに、使用を考慮せずにすべてのレイヤにPLR情報とモードを大まかに追加すると、ビットレートが過負荷になる。したがって、異なる実施形態によれば、投影の異なるレイヤでPLR法を効率的に使用して3D点群を符号化、信号伝達、送信、および復号するための解決策が不足している。そのような解決策を、
図7および8に関連して提案する。
【0151】
PLRを任意の数のレイヤに変更するには、実際の1レイヤモードをマルチレイヤモードの各レイヤに変更する必要がある。次のいくつかの拡張機能が必要である。
●PLRのブロックごと/パッチごとのパラメータが各レイヤで利用可能なこと。
●PLR情報が各レイヤで利用可能なこと。
●PLRの再構築がレイヤごとに実行されること。
【0152】
PLR情報は、処理モードのPLRルックアップテーブルならびに他の高レベルのPLRパラメータを参照することが理解される。PLR情報は、point_local_reconstruction_information構文構造でコード化される。PLRメタデータの送信方法に応じて、例えば、次のようないくつかの実施形態が可能である。
●各レイヤは、そのPLR情報とブロックごと/パッチごとのモードとを有すること。
●複数のレイヤは、同じPLR情報を共有するが、レイヤごとにブロックごと/パッチごとのモードが提供されること。
●共有PLR情報と共有PLRモード。
【0153】
明確にするために、
図7からxxxにおいて、構文は、現在のV-PCC構文(ドキュメントw18479で利用可能)に関連して示されている。
【0154】
図7は、本原理に従って3D点群を復号する方法700を図式的に示している。ステップ710で、本原理に従って符号化されたデータストリームをソースから取得する。データストリームは、レイヤ化画像で符号化された3D点群を表すデータを含む。ステップ720で、レイヤをストリームから復号する。レイヤ画像は、このレイヤをPLR法に従って復号する必要があるかどうかを示す少なくともPLRフラグを含むメタデータと関連付けられている。このレイヤと関連付けられたメタデータを、ストリームから復号する。それらは、異なる時間に、および/またはデータストリーム内の異なる位置から復号された可能性がある。ステップ730で、PLRフラグが有効にされているかどうか(例えば、1に設定されたフラグが有効にされている)をチェックするためのテストを実行する。PLRフラグが無効になっている場合、レイヤは従来の方法を使用して投影解除される。そうでなければ、PLRフラグが有効になっている場合、つまりPLR法がこのレイヤに適用される場合は、このレイヤのPLR情報とモードを取得する必要がある。ステップ740で、メタデータが、別のレイヤと関連付けられたPLR情報を指すインデックスを含むかどうかをチェックするためのテストを実行する。そうでない場合、ステップ741で、PLR情報を、メタデータから取得し、それを取得することを可能にするインデックスとともにメモリに格納する。PLR情報インデックスが現在のレイヤのメタデータで提供される場合、ステップ742で、このインデックスによりPLR情報をメモリから取得する。ステップ750で、PLRモードのインデックスがメタデータに提供されているかどうかをチェックするためのテストを実行する。ステップ750は、ステップ740の前、後、または並行して発生し得る。PLRモードインデックスが提供されていない場合、ステップ751で、現在のレイヤのPLRモードをメタデータから取得し、それらを取得することができるインデックスとともにメモリに格納する。PLRモードインデックスが現在のレイヤのメタデータで提供される場合、ステップ752で、このインデックスによりPLRモードをメモリから取得する。ステップ760で、レイヤを、取得したPLR情報に従ってレイヤのピクセルに、取得したモードを適用することにより、PLR法を使用して投影解除する。
【0155】
図8は、本原理に従って3D点群を符号化する方法800を図式的に示している。ステップ810で、レイヤを取得し、データストリーム内に符号化する。続くステップで、この現在のレイヤと関連付けられたメタデータをデータストリーム内に符号化する。これらのメタデータは、時間内およびデータストリーム内でレイヤの前または後で符号化してもよい。ステップ820で、PLR法に従ってレイヤが復号される必要があるかどうかを示すPLRフラグをメタデータ内に符号化する。PLRフラグが有効にされている場合(例えば、1に設定されたフラグが有効にされている場合)、ステップ840でテストを実行し、現在のレイヤのPLR情報が別のレイヤと関連付けられたメタデータ内にすでに符号化されている(または符号化される)かどうかをチェックする。そうでない場合、ステップ841で、現在のレイヤのPLR情報を、この現在のレイヤと関連付けられたメタデータ内に符号化する。そうでなければ、ステップ842で、別のレイヤのPLR情報を取得することを可能にするインデックスを符号化する。ステップ850で、テストを実行して、現在のレイヤのPLRモードが別のレイヤと関連付けられたメタデータ内にすでに符号化されている(または符号化される)かどうかをチェックする。ステップ850は、ステップ840の前、後、または並行して実行され得る。PLRモードが別のレイヤと共有されていない場合、ステップ851で、現在のレイヤのPLRモードを、この現在のレイヤと関連付けられたメタデータ内に符号化する。そうでなければ、ステップ852で、別のレイヤのPLRモードを取得することを可能にするインデックスを符号化する。
【0156】
以下の説明では、現在のV-PCC仕様(w18479)で説明されている構文に対する提案された変更について詳しく説明する。
【0157】
一実施形態では、各レイヤは、そのPLR情報およびPLRブロックごと/パッチごとのモードを有する。この実施形態では、PLRパラメータは、レイヤごとに最適化されている。
【0158】
シーケンスパラメータセットの構文レベル(w18479
:ハイパーリンク"https://wg11.sc29.org/doc_end_user/current_document.php?id=68044&id_meeting=178"の7.3.4.1パラグラフ)で、次のように、レイヤごとにPLRプロセスを有効にする可能性を追加する。
【表1】
【0159】
sps_point_local_reconstruction_layer_enabled_flag[layer]が1の場合、対応するレイヤインデックスでの点群再構築プロセス中にローカル再構築モードを使用し得ることを示す。sps_point_local_reconstruction_layer_enabled_flag[layer]が0の場合、対応するレイヤインデックスでの点群再構築プロセス中にローカル再構築モードを使用しないことを示す。
【0160】
パッチシーケンスパラメータセットの構文レベル(w18479
:ハイパーリンク"https://wg11.sc29.org/doc_end_user/current_document.php?id=68044&id_meeting=178"の7.3.5.3パラグラフ)で、次のように、レイヤごとにPLR情報を定義する可能性を追加する。
【表2】
【0161】
point_local_reconstruction_information(layer)構文メソッドが変更され、パラメータが点局所再構築情報配列のインデックス「layer」に格納される。変更された方法は、セクション「エラー!参照元が見つかりません」に示される。
【0162】
パッチデータユニットの構文(w18479
:ハイパーリンク"https://wg11.sc29.org/doc_end_user/current_document.php?id=68044&id_meeting=178"の7.3.6.3パラグラフ)は、次のように変更される。
【表3】
【0163】
デルタパッチデータユニットの構文(w18479
:ハイパーリンク"https://wg11.sc29.org/doc_end_user/current_document.php?id=68044&id_meeting=178"の7.3.6.4パラグラフ)は、次のように変更される。
【表4】
【0164】
変更された点局所再構築構文(w18479の7.3.6.6パラグラフ)は、すべてのデータを2次元配列(レイヤ識別子とパッチインデックス)に格納するように変更される。提案されたバージョンは、次のとおりである。
【表5】
【0165】
次の変更を再構築プロセスに適用する必要がある(w18479
:ハイパーリンク"https://wg11.sc29.org/doc_end_user/current_document.php?id=68044&id_meeting=178"の9.4.4パラグラフで説明されている)。
【表6】
【0166】
別の実施形態では、いくつかのレイヤが同じPLR情報を共有する。PLRのブロックごと/パッチごとのモードは、引き続きレイヤごとに提供される。この実施形態は、いくつかのモードの同じセットを使用することを犠牲にして、PLR情報を送信するために必要なビットレートを減らすことを可能にする(最終的にはすべてのレイヤ、これは復号された点群の視覚的品質をわずかに低下させ得る)。1つまたはいくつかのPLR情報のセットが送信される。PLR情報のセットの数は、レイヤの数よりも少ない場合があるため、インデックスは、PLR情報のどのセットが各レイヤで使用されるかを示す。
【0167】
シーケンスパラメータセットの構文レベル(w18479
:ハイパーリンク"https://wg11.sc29.org/doc_end_user/current_document.php?id=68044&id_meeting=178"の7.3.4.1パラグラフ)で、次のように、レイヤごとにPLRプロセスを有効にする可能性を追加する。
【表7】
【0168】
sps_point_local_reconstruction_information_num_sets_minus1に1を加えたものは、送信されるPLR情報パラメータのセットの数を示す。最小値は1、最大値はレイヤ数である。現在の仕様テキストの唯一の変更点は、PLR情報を格納するための配列(idでインデックス付けされた)の使用である。
【表8】
【0169】
パッチシーケンスパラメータセットの構文レベル(w18479
:ハイパーリンク"https://wg11.sc29.org/doc_end_user/current_document.php?id=68044&id_meeting=178"の7.3.5.3パラグラフ)で、次のように、対応するレイヤで使用するPLR情報を識別するPLR情報IDを定義する可能性を追加する。
【表9】
【0170】
psps_point_local_reconstruction_information_set_id[layer]パラメータは、インデックスが「layer」のレイヤに対応するPLR情報セットのインデックスを示す。次の変更を再構築プロセスに適用する必要がある(w18479
:ハイパーリンク"https://wg11.sc29.org/doc_end_user/current_document.php?id=68044&id_meeting=178"の9.4.4パラグラフで説明されている)。
【表10】
【0171】
別の実施形態では、PLR情報および共有ブロック/パッチごとのモードは、複数のレイヤの間で共有される。これにより、視覚的品質のわずかな低下、および/または複雑さのわずかな増加を犠牲にして、送信するメタデータの量が減少することによりビットレートがさらに低下する。
【0172】
次のセクションでは、上記の実施形態に対して提案された変更に加えて、現在のV-PCC仕様(w18479)に対して提案された変更について詳しく説明する。
【0173】
sps_point_local_reconstruction_information_num_sets_minus1に1を加えたものは、送信されるPLR情報パラメータのセットの数を示す。最小値は1、最大値はレイヤ数である。現在の仕様テキストの唯一の変更点は、PLR情報を格納するための追加の配列(idでインデックス付けされた)の使用である。パッチシーケンスパラメータセットの構文レベル(w18479:ハイパーリンク"https://wg11.sc29.org/doc_end_user/current_document.php?id=68044&id_meeting=178"の7.3.5.3パラグラフ)で、PLR情報に対応する識別子を示す可能性を追加する。
【0174】
パッチデータユニットの構文(w18479
:ハイパーリンク"https://wg11.sc29.org/doc_end_user/current_document.php?id=68044&id_meeting=178"の7.3.6.3パラグラフ)は、次のように変更される。
【表11】
【0175】
pdu_point_local_reconstruction_data_num_sets_minus1は、パッチごとに使用可能なPLRデータのバージョン数を示す。pdu_point_local_reconstruction_data_set_id[patchIndex][layer]パラメータは、パッチ「patchIndex」およびレイヤ「layer」のPLRデータを取得するためのPLRデータセット識別子を示す。
【0176】
デルタパッチデータユニットの構文(w18479
:ハイパーリンク"https://wg11.sc29.org/doc_end_user/current_document.php?id=68044&id_meeting=178"の7.3.6.4パラグラフ)は、次のように変更される。
【表12】
【0177】
次の変更を再構築プロセスに適用する必要がある(w18479
:ハイパーリンク"https://wg11.sc29.org/doc_end_user/current_document.php?id=68044&id_meeting=178"の9.4.4パラグラフで説明されている)。
【表13】
【0178】
変形例では、パッチデータユニットおよびデルタパッチデータユニットは、PLRデータのみをパッチレベルで取得する必要があるので、現在の実施形態と比較して次のように単純化される。
【表14】
【表15】
【表16】
【0179】
pfps_point_local_reconstruction_data_num_sets_minus1は、PLRデータのセット数を示す。
【0180】
pfps_point_local_reconstruction_data_set_idは、pfps_point_local_reconstruction_data_num_sets_minus1の可能なバージョンの中でどのPLRデータのセットを使用する必要があるかを示す。
【0181】
同じ実施形態の別の変形例では、PLRデータのセット識別子をシーケンスごとおよびレイヤごとに一度だけ送信することによって、より高いビットレート削減を行う。ここでは、「シーケンス」という用語は、HEVC規格と同じ意味で使用される。
【0182】
パッチデータユニットおよびデルタパッチデータユニットは、PLRデータのみをパッチレベルで取得すればよいので、現在の実施形態と比較して次のように単純化される。
【表17】
【表18】
【表19】
【0183】
psps_point_local_reconstruction_data_num_sets_minus1は、PLRデータのセット数を定義する。
【0184】
psps_point_local_reconstruction_data_set_idは、psps_point_local_reconstruction_data_num_sets_minus1に1を加えた可能なバージョンの中で使用するPLRデータのセットを示す。
【0185】
再構築プロセスの変更は、次のとおりである。
E3のpdu_point_local_reconstruction_data_set_id[f][p][l]は、次のように初期化される。
●E3.V1の場合は、pfps_point_local_reconstruction_data_set_id[f][l]、すなわち、所与のフレームに対して、すべてのパッチが同じセットIDを使用する。
●E3.V2の場合は、psps_point_local_reconstruction_data_set_id[l]、すなわち、すべてのフレームで、すべてのパッチが同じセットIDを使用する。
ここで、
●fは、フレームインデックスに対応する。
●pは、パッチインデックスに対応する。
●lは、レイヤインデックスに対応する。
【0186】
現在の実施形態と比較して、PLRデータのセット数は、次のように示される。
●pfps_point_local_reconstruction_data_num_sets_minus1を用いるフレームレベル(E3.V1の場合)
●またはpsps_point_local_reconstruction_data_num_sets_minus1を用いるシーケンスレベル(E3.V2の場合)。
【0187】
ブロック図および動作フローチャートに関して、いくつかの例を説明する。各ブロックは、指定された論理機能を実装するための1つ以上の実行可能な命令を含む回路要素、モジュール、またはコードの一部を表す。他の実装形態では、ブロックに記載されている機能が記載されている順序とは異なる順序で発生し得ることにも留意されたい。例えば、連続して示されている2つのブロックは、実際、実質的に同時に実行されることがあるか、またはブロックは、伴う機能に応じて、時には逆の順序で実行されることがある。
【0188】
本明細書で説明された実装形態および態様は、例えば、方法もしくは処理、装置、ソフトウェアプログラム、データストリーム、ビットストリーム、または信号に実装され得る。単一の実装形態の文脈でのみ考察される(例えば、方法としてのみ考察される)場合であっても、考察される特徴の実装はまた、他の形態(例えば、装置またはプログラム)で実装され得る。
【0189】
この方法は、例えば、コンピュータ、マイクロプロセッサ、集積回路、またはプログラマブルロジックデバイスを含む、一般に処理デバイスを指す、例えば、プロセッサに実装され得る。プロセッサは、通信デバイスも含む。
【0190】
加えて、方法は、プロセッサによって実施される命令によって実装され得、そのような命令(および/または実装形態によって生成されるデータ値)は、コンピュータ可読記憶媒体に記憶され得る。コンピュータ可読記憶媒体は、1つ以上のコンピュータ可読媒体で具現化され、かつコンピュータで実行可能なコンピュータ可読プログラムコードがその上で具現化されるコンピュータ可読プログラム製品の形態を採ることができる。本明細書で使用されるコンピュータ可読記憶媒体は、そこに情報を記憶する固有の能力、ならびにそこから情報の取得を提供する固有の能力が与えられた非一時的記憶媒体とみなされる。コンピュータ可読記憶媒体は、例えば、電子、磁気、光学、電磁気、赤外線、もしくは半導体のシステム、装置、もしくはデバイス、または前述の任意の好適な組み合わせとすることができるが、これらに限定されない。以下は、本実施形態を適用し得るコンピュータ可読記憶媒体のより具体的な例を提供するが、当業者によって容易に理解されるように、ポータブルコンピュータディスケット、ハードディスク、読み出し専用メモリ(ROM)、消去可能プログラマブル読み出し専用メモリ(EPROMもしくはフラッシュメモリ)、ポータブルコンパクトディスク読み出し専用メモリ(CD-ROM)、光学ストレージデバイス、磁気ストレージデバイス、または前述のいずれかの好適な組み合わせは、単に例示的であり、網羅的なリストではないことを理解されたい。
【0191】
命令は、プロセッサ可読媒体に有形に具現化されるアプリケーションプログラムを形成することができる。
【0192】
命令は、例えばハードウェア、ファームウェア、ソフトウェア、または組み合わせで行うことができる。命令は、例えば、オペレーティングシステム、個別アプリケーション、または2つの組み合わせに見出すことができる。したがって、プロセッサは、例えば、処理を実行するように構成されたデバイス、および処理を実行する命令を有するプロセッサ可読媒体(ストレージデバイスなど)を含むデバイスの両方として特徴付けることができる。さらに、プロセッサ可読媒体は、命令に加えて、または命令の代わりに、実装形態により生成されるデータ値を記憶することができる。
【0193】
装置は、例えば、適切なハードウェア、ソフトウェア、およびファームウェアで実装することができる。このような装置の例には、パーソナルコンピュータ、ラップトップ、スマートフォン、タブレットコンピュータ、デジタルマルチメディアセットトップボックス、デジタルテレビ受信機、パーソナルビデオ録画システム、接続された家電製品、ヘッドマウントディスプレイデバイス(HMD、シースルーグラス)、プロジェクタ(ビーマー)、「Cave」(複数のディスプレイを含むシステム)、サーバ、ビデオ符号化器、ビデオ復号器、ビデオ復号器からの出力を処理するポストプロセッサ、ビデオ符号化器への入力を提供するプリプロセッサ、Webサーバ、セットトップボックス、ならびに点群、ビデオ、画像、または他の通信デバイスを処理するための他のデバイス、が含まれる。明らかであるはずであるように、機器は、可搬式とすることができ、移動車両にさえ搭載することができる。
【0194】
コンピュータソフトウェアを、プロセッサ6010によって、またはハードウェアによって、またはハードウェアとソフトウェアとの組み合わせによって、実装してもよい。非限定的な例として、実施形態は、1つ以上の集積回路によって実装され得る。メモリ6020は、技術的環境に適切な任意のタイプであり得、非限定的な例として、光学メモリデバイス、磁気メモリデバイス、半導体ベースのメモリデバイス、固定メモリ、および取り外し可能メモリなどの任意の適切なデータストレージ技術を使用して実装され得る。プロセッサ6010は、技術的環境に適切な任意のタイプであり得、非限定的な例として、マイクロプロセッサ、汎用コンピュータ、専用コンピュータ、およびマルチコアアーキテクチャに基づくプロセッサのうちの1つ以上を包含し得る。
【0195】
当業者にとって明らかであるように、実装形態は、例えば、記憶または送信することができる情報を搬送するようにフォーマットされる多種多様な信号を生成することができる。情報は、例えば、方法を実行する命令、または説明される実装形態のうちの1つにより生成されるデータを含むことができる。例えば、信号は、説明された実施形態のビットストリームを搬送するようにフォーマットされてもよい。そのような信号は、例えば、電磁波(例えば、スペクトルの無線周波数部分を使用して)として、またはベースバンド信号としてフォーマットされてもよい。フォーマットすることは、例えば、データストリームを符号化することと、搬送波を符号化データストリームで変調することと、を含むことができる。信号が搬送する情報は、例えば、アナログ情報またはデジタル情報とすることができる。信号は、既知のように、多種多様な異なる有線リンクまたは無線リンクを介して送信され得る。信号は、プロセッサ可読媒体に格納することができる。
【0196】
本明細書で使用される用語は、特定の実施形態を説明することのみを目的とし、本開示を限定することを意図するものではない。本明細書で使用される場合、単数形「a」、「an」、および「the」は、特に文脈が明示しない限り、複数形も含むことが意図される。本明細書で使用される場合、「含む/備える」および/または「含んでいる/備えている」という用語は、述べられた、例えば、特徴、整数、ステップ、動作、要素、および/または構成要素の存在を特定し得るが、1つ以上の他の特徴、整数、ステップ、動作、要素、構成要素、および/またはそれらのグループの存在または追加を排除しないことがさらに理解されよう。さらに、要素が別の要素に「応答する」または「接続される」と言及される場合、それは他の要素に直接応答するか、もしくは接続され得るか、または介在する要素が存在し得る。対照的に、要素が他の要素に「直接応答する」または「直接接続される」と言及される場合、介在する要素は存在しない。
【0197】
例えば、「A/B」、「Aおよび/またはB」、ならびに「AおよびBのうちの少なくとも1つ」の場合の「/」、「および/または」、ならびに「のうちの少なくとも1つ」のいずれかの使用は、最初に挙げた選択肢(A)のみの選択、または2番目に挙げた選択肢(B)のみの選択、または両方の選択肢(AおよびB)の選択を網羅することを意図していることが分かるはずである。さらなる例として、「A、B、および/またはC」ならびに「A、B、およびCのうちの少なくとも1つ」の場合、そのような言い回しは、1番目に列記された選択肢(A)のみの選択、または2番目に列記された選択肢(B)のみの選択、または3番目に列記された選択肢(C)のみの選択、または1番目および2番目に列記された選択肢(AおよびB)のみの選択、または1番目および3番目に列記された選択肢(AおよびC)のみの選択、または2番目および3番目に列記された選択肢(BおよびC)のみの選択、または3つすべての選択肢(AおよびBおよびC)の選択、を網羅することを意図している。これは、当業者にとって明らかなように、挙げられる項目の数だけ拡張され得る。
【0198】
本出願では、様々な数値が使用され得る。特定の値は、例示的な目的のためであり、説明された態様は、これらの特定の値に限定されるものではない。
【0199】
本明細書では、第1、第2などの用語を使用して様々な要素を説明する場合があるが、これらの要素はこれらの用語によって限定されるべきではないことが理解されよう。これらの用語は、ある要素を別の要素と区別するためにのみ使用される。例えば、本出願の教示から逸脱することなく、第1の要素は、第2の要素と称され得、同様に、第2の要素は、第1の要素と称され得る。第1の要素と第2の要素の間に順序付けの意味はない。
【0200】
「ある実施形態」もしくは「一実施形態」、または「ある実装形態」もしくは「一実装形態」、ならびにそれらの他の変形への言及は、(実施形態/実装形態に関連して説明された)特定の特徴、構造、特性などが、少なくとも1つの実施形態/実装形態に含まれることを伝えるために頻繁に使用される。したがって、本出願全体にわたって様々な箇所においてみられる、「一実施形態では」もしくは「ある実施形態では」または「一実装形態では」もしくは「ある実装形態では」という句、ならびに任意の他の変形の出現は、必ずしもすべてが同じ実施形態を指しているわけではない。
【0201】
同様に、本明細書における「ある実施形態/例/実装形態による」または「ある実施形態/例/実装形態では」、ならびにそれらの他の変形への言及は、(実施形態/例/実装形態に関連して説明された)特定の特徴、構造、特性が、少なくとも1つの実施形態/例/実装形態に含まれ得ることを伝えるために頻繁に使用される。本明細書の様々な場所での「ある実施形態/例/実装形態による」または「ある実施形態/例/実装形態では」という語句の出現は、必ずしもすべて同じ実施形態/例/実装形態を指しているわけではなく、別個または代替の実施形態/例/実装形態が他の実施形態/例/実装形態を必ずしも相互に排除しているわけでもない。
【0202】
特許請求の範囲に現れる参照番号は、例示としてのみであり、特許請求の範囲の範囲に限定的な影響を与えないものとする。明示的には説明されていないが、本実施形態/例および変形例は、任意の組み合わせまたは部分的な組み合わせで用いられ得る。
【0203】
図がフロー図として提示されている場合、それは、対応する装置のブロック図も提供することを理解されたい。同様に、図がブロック図として提示されている場合、それは、対応する方法/プロセスのフロー図も提供することを理解されたい。
【0204】
一部の図は、通信の主要な方向を示すために通信経路上に矢印を含んでいるが、通信は、描かれた矢印と反対の方向で発生することがあることを理解されたい。
【0205】
様々な実装形態は、復号を伴う。本出願で使用される「復号」は、再構築点群ドメインでの表示またはさらなる処理に好適な最終的な出力を生成するために、例えば、受信点群フレーム(場合によっては、1つ以上の点群フレームを符号化する受信ビットストリームを含む)で実行されるプロセスの全部または一部を包含し得る。様々な実施形態では、そのようなプロセスは、典型的には、画像ベース符号化器によって実行されるプロセスのうちの1つ以上を含む。
【0206】
さらなる例として、ある実施形態では、「復号」は、エントロピー復号のみを指し得、別の実施形態では、「復号」は、差分復号のみを指し得、別の実施形態では、「復号」は、エントロピー復号と差分復号との組み合わせを指し得る。「復号プロセス」という句が、具体的に動作のサブセット、または概してより広い復号プロセスを指すことを意図し得るかは、特定の説明の文脈に基づいて明確になり、かつ当業者によって十分に理解されると考えられる。
【0207】
様々な実装形態は、符号化を伴う。「復号」に関する上記の考察と同様に、本出願で使用される「符号化」は、例えば、符号化されたビットストリームを生成するために入力点群フレームで実行されるプロセスの全部または一部を包含し得る。様々な実施形態では、そのようなプロセスは、典型的には、画像ベース符号化器によって実行されるプロセスのうちの1つ以上を含む。
【0208】
さらなる例として、一実施形態では、「符号化」は、エントロピー符号化のみを指し得、別の実施形態では、「符号化」は、差分符号化のみを指し得、別の実施形態では、「符号化」は、差分符号化とエントロピー符号化との組み合わせを指し得る。「符号化プロセス」という句が、具体的に動作のサブセット、または概してより広い符号化プロセスを指すことを意図し得るかは、具体的な説明の文脈に基づいて明確になり、かつ当業者によって十分に理解されると考えられる。
【0209】
なお、本明細書で使用されている構文要素、例えば、フラグoint_local_reconstruction_mode_present_flagは、説明的な用語である。したがって、それらは、他の構文要素名の使用を排除するものではない。
【0210】
様々な実施形態は、レート歪み最適化について言及する。特に、符号化プロセス中、多くの場合に計算の複雑さの制約を考えて、レートと歪みとの間のバランスまたはトレードオフが、通常、考慮される。レート歪みの最適化は、通常、レートと歪みの加重和であるレート歪み関数を最小化するように定式化され得る。レート歪みの最適化問題を解決するには、異なるアプローチがある。例えば、アプローチは、考慮されるすべてのモードまたはコード化パラメータ値を含む、すべての符号化オプションの広範なテストに基づき得、コード化および復号後の再構築された信号のコード化コストおよび関連する歪みの完全な評価を伴う。特に、再構築された信号ではなく、予測または予測残差信号に基づいて近似歪みを計算することによって、符号化の複雑さを軽減するために、より高速なアプローチを使用することもできる。可能な符号化オプションの一部にのみ近似歪みを使用し、他の符号化オプションに完全な歪みを使用することなどによって、これら2つのアプローチを組み合わせて使用することもできる。他のアプローチでは、可能な符号化オプションのサブセットのみを評価する。より一般的には、多くのアプローチが、最適化を実行するための様々な技術のうちのいずれかを採用するが、最適化は、必ずしもコード化コストおよび関連する歪みの両方の完全な評価ではない。
【0211】
さらに、本出願は、情報の様々な部分を「判断する」ことに言及する場合がある。情報を判断することは、例えば、情報を推定すること、情報を計算すること、情報を予測すること、またはメモリから情報を検索することのうちの1つ以上を含むことができる。
【0212】
さらに、本出願は、情報の様々な部分に「アクセスすること」に言及する場合がある。情報にアクセスすることは、例えば、情報を受信すること、情報を検索すること(例えば、メモリから)、情報を記憶すること、情報を移動させること、情報をコピーすること、情報を計算すること、情報を判断すること、情報を予測すること、または情報を推定することのうちの1つ以上を含むことができる。
【0213】
さらに、本出願は、情報の様々な部分を「受信すること」に言及する場合がある。受信することは、「アクセスすること」と同様に、広義の用語であることが意図されている。情報を受信することは、例えば、情報にアクセスすること、または(例えば、メモリから)情報を取り出すことのうちの1つ以上を含み得る。さらに、「受信すること」は、典型的には、何らかの方法で、例えば、情報の記憶、情報の処理、情報の送信、情報の移動、情報のコピー、情報の消去、情報の計算、情報の判断、情報の予測、または情報の評価などの動作中に伴う。
【0214】
また、本明細書で使用される場合、「信号伝達する」という単語は、とりわけ、対応する復号器に何かを指し示すことを指す。例えば、特定の実施形態では、符号化器は、特定の構文要素SEおよび/またはPLRメタデータに信号伝達する。このようにして、実施形態では、同じパラメータ(PLRメタデータ)が、符号化器側および復号器側の両方で使用され得る。したがって、例えば、符号化器は、特定のパラメータを復号器に送信することができ(明示的な信号伝達)、その結果、復号器は、同じ特定のパラメータを使用することができる。逆に、復号器が既に特定のパラメータならびに他のパラメータを有する場合、信号伝達は、送信(暗黙的な信号伝達)を行わずに使用されて、復号器が簡単に特定のパラメータを認識して選択するのを可能にすることができる。いかなる実際の機能の送信も回避することによって、ビットの節約が、様々な実施形態で実現される。信号伝達は、様々な方式で達成され得ることが分かるはずである。例えば、1つ以上の構文要素、フラグなどが、様々な実施形態で、対応する復号器に情報を信号伝達するために使用される。上記は、「信号伝達する」という単語の動詞形に関するものであるが、「信号伝達」という単語はまた、本明細書では、名詞として使用することもできる。
【0215】
多数の実装形態が説明されてきた。それにもかかわらず、様々な変更を行うことができることが理解されよう。例えば、異なる実装形態の要素は、他の実装形態を生成するために組み合わせる、補足する、変更する、または削除することができる。また、当業者であれば、他の構造および処理を、開示される構造および処理に替えて用いることができ、結果として得られる実装形態が、少なくとも実質的に同じ機能を、少なくとも実質的に同じ方法で実行して、開示される実装形態として少なくとも実質的に同じ結果を達成することを理解するであろう。したがって、これらの実装形態および他の実装形態は、本出願により想到される。