IP Force 特許公報掲載プロジェクト 2022.1.31 β版

知財求人 - 知財ポータルサイト「IP Force」

▶ テンセント・アメリカ・エルエルシーの特許一覧

特表2024-533326動的メッシュ圧縮のための境界情報を用いた三角形分割法、装置及びコンピュータプログラム
<>
  • 特表-動的メッシュ圧縮のための境界情報を用いた三角形分割法、装置及びコンピュータプログラム 図1
  • 特表-動的メッシュ圧縮のための境界情報を用いた三角形分割法、装置及びコンピュータプログラム 図2
  • 特表-動的メッシュ圧縮のための境界情報を用いた三角形分割法、装置及びコンピュータプログラム 図3
  • 特表-動的メッシュ圧縮のための境界情報を用いた三角形分割法、装置及びコンピュータプログラム 図4
  • 特表-動的メッシュ圧縮のための境界情報を用いた三角形分割法、装置及びコンピュータプログラム 図5
  • 特表-動的メッシュ圧縮のための境界情報を用いた三角形分割法、装置及びコンピュータプログラム 図6
  • 特表-動的メッシュ圧縮のための境界情報を用いた三角形分割法、装置及びコンピュータプログラム 図7
  • 特表-動的メッシュ圧縮のための境界情報を用いた三角形分割法、装置及びコンピュータプログラム 図8
  • 特表-動的メッシュ圧縮のための境界情報を用いた三角形分割法、装置及びコンピュータプログラム 図9
  • 特表-動的メッシュ圧縮のための境界情報を用いた三角形分割法、装置及びコンピュータプログラム 図10
  • 特表-動的メッシュ圧縮のための境界情報を用いた三角形分割法、装置及びコンピュータプログラム 図11
  • 特表-動的メッシュ圧縮のための境界情報を用いた三角形分割法、装置及びコンピュータプログラム 図12
  • 特表-動的メッシュ圧縮のための境界情報を用いた三角形分割法、装置及びコンピュータプログラム 図13
  • 特表-動的メッシュ圧縮のための境界情報を用いた三角形分割法、装置及びコンピュータプログラム 図14
< >
(19)【発行国】日本国特許庁(JP)
(12)【公報種別】公表特許公報(A)
(11)【公表番号】
(43)【公表日】2024-09-12
(54)【発明の名称】動的メッシュ圧縮のための境界情報を用いた三角形分割法、装置及びコンピュータプログラム
(51)【国際特許分類】
   G06T 17/20 20060101AFI20240905BHJP
【FI】
G06T17/20 500
【審査請求】有
【予備審査請求】未請求
(21)【出願番号】P 2024515113
(86)(22)【出願日】2023-03-20
(85)【翻訳文提出日】2024-03-07
(86)【国際出願番号】 US2023015603
(87)【国際公開番号】W WO2023196107
(87)【国際公開日】2023-10-12
(31)【優先権主張番号】63/327,209
(32)【優先日】2022-04-04
(33)【優先権主張国・地域又は機関】US
(31)【優先権主張番号】18/185,117
(32)【優先日】2023-03-16
(33)【優先権主張国・地域又は機関】US
(81)【指定国・地域】
(71)【出願人】
【識別番号】520353802
【氏名又は名称】テンセント・アメリカ・エルエルシー
(74)【代理人】
【識別番号】100110364
【弁理士】
【氏名又は名称】実広 信哉
(74)【代理人】
【識別番号】100150197
【弁理士】
【氏名又は名称】松尾 直樹
(72)【発明者】
【氏名】シャン・ジャン
(72)【発明者】
【氏名】チャオ・フアン
(72)【発明者】
【氏名】ジュン・ティアン
(72)【発明者】
【氏名】シャオジョン・シュ
(72)【発明者】
【氏名】シャン・リュウ
(57)【要約】
エンコーダからコーディングされたビデオビットストリームを受信し、コーディングされたビデオビットストリームから、ボリュームオブジェクトの表面を記述する複数のポリゴンを含むメッシュを取り出し、メッシュの境界上またはメッシュの内部に位置する、メッシュの1つまたは複数の頂点を三角形分割し、1つまたは複数の頂点の三角形分割を使用して、1つまたは複数の頂点間の接続性情報を推測し、接続性情報に基づいて1つまたは複数の境界UV座標を再構成する、方法および装置。
【特許請求の範囲】
【請求項1】
デコーダ内の少なくとも1つのプロセッサによって実行される方法であって、前記方法は、
エンコーダからコーディングされたビデオビットストリームを受信するステップと、
前記コーディングされたビデオビットストリームから、ボリュームオブジェクトの表面を記述する複数のポリゴンを含むメッシュを取り出すステップと、
前記メッシュの1つまたは複数の頂点を三角形分割するステップであって、前記1つまたは複数の頂点は、前記メッシュの境界上または前記メッシュの内部に位置する、ステップと、
前記1つまたは複数の頂点の前記三角形分割を使用して、前記1つまたは複数の頂点間の接続性情報を推測するステップと、
前記接続性情報に基づいて1つまたは複数の境界UV座標を再構成するステップとを含む、方法。
【請求項2】
前記メッシュの前記境界上に位置する前記1つまたは複数の頂点は、可逆的にコーディングされる、請求項1に記載の方法。
【請求項3】
前記メッシュの前記内部に位置する前記1つまたは複数の頂点は、サンプリングされる、請求項1に記載の方法。
【請求項4】
前記メッシュ内の複数のサンプリングされた近傍点の間の接続性情報を推測するステップをさらに含む、請求項1に記載の方法。
【請求項5】
前記再構成された境界UV座標は、1つまたは複数の三角形メッシュおよび1つまたは複数の四角形メッシュを生成するハイブリッドメッシュを形成する、請求項1に記載の方法。
【請求項6】
前記メッシュの前記境界上に位置する前記1つまたは複数の頂点は、非可逆的にコーディングされる、請求項1に記載の方法。
【請求項7】
1つまたは複数の重複した頂点をセットから除去して1セットの一意の境界頂点を生成するステップと、
前記1つまたは複数の重複した頂点の1つまたは複数のインデックスを記録するステップと、
サンプリングされた前記メッシュの前記内部に位置する前記頂点とともに、前記1セットの一意の境界頂点を三角形分割するステップと
をさらに含む、請求項6に記載の方法。
【請求項8】
プログラムコードを記憶するように構成された少なくとも1つのメモリと、
前記プログラムコードを読み取り、前記プログラムコードの指示に従って動作するように構成された少なくとも1つのプロセッサであって、前記プログラムコードは、
前記少なくとも1つのプロセッサに、エンコーダからコーディングされたビデオビットストリームを受信させるように構成された受信コードと、
前記少なくとも1つのプロセッサに、ボリュームオブジェクトの表面を記述する複数のポリゴンを含むメッシュを、前記コーディングされたビデオビットストリームから取り出させるように構成された取り出しコードと、
前記少なくとも1つのプロセッサに、前記メッシュの1つまたは複数の頂点を三角形分割させるように構成された第1の三角形分割コードであって、前記1つまたは複数の頂点は、前記メッシュの境界上または前記メッシュの内部に位置する、第1の三角形分割コードと、
前記1つまたは複数の頂点の前記三角形分割を使用して、前記少なくとも1つのプロセッサに、前記1つまたは複数の頂点間の接続性情報を推測させるように構成された推測コードと、
前記少なくとも1つのプロセッサに、前記接続性情報に基づいて1つまたは複数の境界UV座標を再構成させるように構成された再構成コードとを含む、少なくとも1つのプロセッサと
を備える、装置。
【請求項9】
前記メッシュの前記境界上に位置する前記1つまたは複数の頂点は、可逆的にコーディングされる、請求項8に記載の装置。
【請求項10】
前記メッシュの前記内部に位置する前記1つまたは複数の頂点は、サンプリングされる、請求項8に記載の装置。
【請求項11】
前記メッシュ内の複数のサンプリングされた近傍点の間の接続性情報を推測するステップをさらに含む、請求項1に記載の方法。
【請求項12】
前記再構成された境界UV座標は、1つまたは複数の三角形メッシュおよび1つまたは複数の四角形メッシュを生成するハイブリッドメッシュを形成する、請求項8に記載の装置。
【請求項13】
前記メッシュの前記境界上に位置する前記1つまたは複数の頂点は、非可逆的にコーディングされる、請求項8に記載の装置。
【請求項14】
前記プログラムコードは、
前記少なくとも1つのプロセッサに、1つまたは複数の重複した頂点をセットから除去して1セットの一意の境界頂点を生成させるように構成された除去コードと、
前記少なくとも1つのプロセッサに、前記1つまたは複数の重複した頂点の1つまたは複数のインデックスを記録させるように構成された記録コードと、
前記少なくとも1つのプロセッサに、サンプリングされた前記メッシュの前記内部に位置する前記頂点とともに、前記1セットの一意の境界頂点を三角形分割させるように構成された第2の三角形分割コードとをさらに含む、請求項13に記載の装置。
【請求項15】
少なくとも1つのプロセッサによって実行されると、前記少なくとも1つのプロセッサに、
エンコーダからコーディングされたビデオビットストリームを受信させ、
前記コーディングされたビデオビットストリームから、ボリュームオブジェクトの表面を記述する複数のポリゴンを含むメッシュを取り出させ、
前記メッシュの1つまたは複数の頂点を三角形分割させ、前記1つまたは複数の頂点は、前記メッシュの境界上または前記メッシュの内部に位置し、
前記1つまたは複数の頂点の前記三角形分割を使用して、前記1つまたは複数の頂点間の接続性情報を推測させ、
前記接続性情報に基づいて1つまたは複数の境界UV座標を再構成させる命令を記憶する、非一時的なコンピュータ可読記憶媒体。
【請求項16】
前記メッシュの前記境界上に位置する前記1つまたは複数の頂点は、可逆的にコーディングされる、請求項15に記載の非一時的なコンピュータ可読記憶媒体。
【請求項17】
前記メッシュの前記内部に位置する前記1つまたは複数の頂点は、サンプリングされる、請求項15に記載の非一時的なコンピュータ可読記憶媒体。
【請求項18】
前記メッシュ内の複数のサンプリングされた近傍点の間の接続性情報を推測することをさらに含む、請求項15に記載の非一時的なコンピュータ可読記憶媒体。
【請求項19】
前記再構成された境界UV座標は、1つまたは複数の三角形メッシュおよび1つまたは複数の四角形メッシュを生成するハイブリッドメッシュを形成する、請求項15に記載の非一時的なコンピュータ可読記憶媒体。
【請求項20】
前記メッシュの前記境界上に位置する前記1つまたは複数の頂点は、非可逆的にコーディングされる、請求項15に記載の非一時的なコンピュータ可読記憶媒体。
【発明の詳細な説明】
【技術分野】
【0001】
関連出願の相互参照
本出願は、2022年4月4日に出願された米国仮出願第63/327,209号および2023年3月16日に出願された米国特許出願第18/185,117号の優先権を主張し、これらの開示はその全体が参照により本明細書に組み込まれる。
【0002】
本開示は、高度なビデオコーディング技術のセットを対象とする。より具体的には、本開示は、動的メッシュ圧縮のための境界情報を用いた三角形分割法を対象とする。
【背景技術】
【0003】
3Dキャプチャ、モデリング、レンダリングの進歩により、いくつかのプラットフォームおよびデバイスにわたる3Dコンテンツのユビキタスな存在が促進された。現在では、ある大陸で赤ちゃんの最初の一歩を撮影し、祖父母が別の大陸でその子どもを見て(そしておそらく交流し)、完全な没入体験を楽しむことができる。それにもかかわらず、そのような現実性を実現するために、モデルは、これまで以上に洗練されてきており、かなりの量のデータがそれらのモデルの作成および消費に結び付けられる。3Dメッシュがそのような没入型コンテンツを表現するために広く使用される。
【0004】
動的メッシュシーケンスは、これが経時的に変化するかなりの量の情報で構成されうるので、大量のデータを必要とする場合がある。したがって、そのようなコンテンツを保存し、かつ送信するために効率的な圧縮技術が必要となる。メッシュ圧縮規格IC、MESHGRID、FAMCは、常時接続性および時変ジオメトリおよび頂点属性を有する動的メッシュに対処するためにMPEGによって以前に開発された。しかしながら、これらの規格は、時変属性マップおよび接続性情報を考慮に入れない。通常、DCC(デジタルコンテンツ作成)ツールは、このような動的メッシュを生成する。一方、特にリアルタイム制約下で、ボリューム取得技術が一定の接続性動的メッシュを生成することは困難である。この種のコンテンツは、既存の規格ではサポートされていない。MPEGは、時変接続性情報を有する動的メッシュを直接扱うための新たなメッシュ圧縮規格を開発することを計画しており、時変属性マップが含まれうる。この規格は、リアルタイム通信、記憶、自由視点ビデオ、AR、およびVRなどの様々な用途のための非可逆圧縮および可逆圧縮を対象としている。ランダムアクセスおよびスケーラブル/プログレッシブコーディングなどの機能も考慮される。
【発明の概要】
【課題を解決するための手段】
【0005】
以下は、本開示の1つまたは複数の実施形態の基本的な理解を提供するために、そのような実施形態の簡略化された概要を提示する。本概要は、すべての企図された実施形態の広範な概要ではなく、すべての実施形態の主要なまたは重要な要素を特定することも、いずれかまたはすべての実施形態の範囲を線引きすることも意図されていない。その唯一の目的は、後で提示されるより詳細な説明の前置きとして、本開示の1つまたは複数の実施形態の一部の概念を簡略化された形で提示することである。
【0006】
本開示は、動的メッシュ圧縮のための境界情報を用いた三角形分割法を提供する。
【0007】
いくつかの実施形態によれば、少なくとも1つのプロセッサによって実行される方法が提供される。この方法は、エンコーダからコーディングされたビデオビットストリームを受信するステップを含む。この方法は、コーディングされたビデオビットストリームから、ボリュームオブジェクトの表面を記述する複数のポリゴンを含むメッシュを取り出すステップをさらに含む。この方法は、メッシュの1つまたは複数の頂点を三角形分割するステップをさらに含み、1つまたは複数の頂点は、メッシュの境界上またはメッシュの内部に位置する。この方法は、1つまたは複数の頂点の三角形分割を使用して、1つまたは複数の頂点間の接続性情報を推測するステップをさらに含む。この方法は、接続性情報に基づいて1つまたは複数の境界UV座標を再構成するステップをさらに含む。
【0008】
いくつかの実施形態によれば、装置は、プログラムコードを記憶するように構成された少なくとも1つのメモリと、プログラムコードを読み取り、プログラムコードの指示に従って動作するように構成された少なくとも1つのプロセッサとを含む。プログラムコードは、少なくとも1つのプロセッサに、エンコーダからコーディングされたビデオビットストリームを受信させるように構成された受信コードを含む。プログラムコードは、少なくとも1つのプロセッサに、ボリュームオブジェクトの表面を記述する複数のポリゴンを含むメッシュを、コーディングされたビデオビットストリームから取り出させるように構成された取り出しコードをさらに含む。プログラムコードは、少なくとも1つのプロセッサに、メッシュの1つまたは複数の頂点を三角形分割させるように構成された三角形分割コードをさらに含み、1つまたは複数の頂点は、メッシュの境界上またはメッシュの内部に位置する。プログラムコードは、1つまたは複数の頂点の三角形分割を使用して、少なくとも1つのプロセッサに、1つまたは複数の頂点間の接続性情報を推測させるように構成された推測コードをさらに含む。プログラムコードは、少なくとも1つのプロセッサに、接続性情報に基づいて1つまたは複数の境界UV座標を再構成させるように構成された再構成コードをさらに含む。
【0009】
いくつかの実施形態によれば、非一時的なコンピュータ可読記憶媒体は、少なくとも1つのプロセッサによって実行されると、少なくとも1つのプロセッサに、エンコーダからコーディングされたビデオビットストリームを受信させる命令を記憶する。この命令はさらに、少なくとも1つのプロセッサに、コーディングされたビデオビットストリームから、ボリュームオブジェクトの表面を記述する複数のポリゴンを含むメッシュを取り出させる。この命令はさらに、少なくとも1つのプロセッサに、メッシュの境界上またはメッシュの内部に位置する、メッシュの1つまたは複数の頂点を三角形分割させる。この命令はさらに、少なくとも1つのプロセッサに、1つまたは複数の頂点の三角形分割を使用して、1つまたは複数の頂点間の接続性情報を推測させる。この命令はさらに、少なくとも1つのプロセッサに、接続性情報に基づいて1つまたは複数の境界UV座標を再構成させる。
【0010】
追加の実施形態は、以下の説明に記載され、部分的には、説明から明らかになり、および/または本開示の提示された実施形態の実施によって知られうる。
【0011】
開示された主題のさらなる特徴、性質、および様々な利点は、以下の詳細な説明および添付の図面からより明らかになるであろう。
【図面の簡単な説明】
【0012】
図1】いくつかの実施形態による通信システムの簡略化されたブロック図の概略図である。
図2】いくつかの実施形態によるストリーミングシステムの簡略化されたブロック図の概略図である。
図3】いくつかの実施形態によるビデオエンコーダおよびデコーダの簡略化されたブロック図の概略図である。
図4】いくつかの実施形態による、3Dメッシュセグメントから2Dチャート上へのUVパラメータ化マッピングのプロセスを示す図である。
図5】いくつかの実施形態による、3Dメッシュセグメントが複数の別々のチャートにマッピングされる異なるUVパラメータ化を示す図である。
図6】いくつかの実施形態による、複数のチャートを有する一般的な2D-UVアトラスである。
図7】いくつかの実施形態による、2Dチャート内の境界頂点を示す図である。
図8】いくつかの実施形態による、可逆的な境界UV頂点および内部サンプリングされた頂点を用いた三角形分割を示す図である。
図9】いくつかの実施形態による、デコーディングされた占有マップ上の近傍点からの接続性を示す図である。
図10】いくつかの実施形態による、2D占有マップからの接続性再構成を示す図である。
図11】いくつかの実施形態による、非可逆的な境界UV頂点および内部サンプリングされた頂点を用いた三角形分割を示す図である。
図12】内部境界頂点を用いた三角形分割を示す図である。
図13】いくつかの実施形態による、動的メッシュ圧縮のための境界情報を用いた三角形分割のためのプログラムによって実行されるステップを示す動作フローチャートである。
図14】実施形態を実装するのに適したコンピュータシステムの図である。
【発明を実施するための形態】
【0013】
例示的な実施形態の以下の詳細な説明は、添付の図面を参照する。異なる図面における同じ参照番号は、同じまたは同様の要素を識別しうる。
【0014】
メッシュは、ボリュームオブジェクトの表面を記述するいくつかのポリゴンを含んでよい。3D空間内のその頂点および頂点がどのように接続されているかの情報は、接続性情報と呼ばれる各ポリゴンを画定することができる。色、法線などの頂点属性をメッシュ頂点に関連付けることができる。属性は、メッシュを2D属性マップでパラメータ化するマッピング情報を利用することにより、メッシュの表面にも関連付けられてよい。いくつかの実施形態では、接続性情報は、ポリゴンの3D空間内の頂点に関する情報を含んでもよく、頂点の互いに対する相対位置、および/または頂点がどのように接続されうるかを記述、指定、またはその他の方法で示してもよい。そのようなマッピングは、UV座標またはテクスチャ座標と呼ばれ、メッシュ頂点に関連するパラメトリック座標のセットを使用して定義されうる。テクスチャ、法線、変位などの高解像度属性情報を保存するために2D属性マップが使用されうる。高解像度属性情報は、テクスチャマッピングやシェーディングなどの様々な目的に使用されうる。
【0015】
上記のように、3Dメッシュまたは動的メッシュは、経時的に変化するかなりの量の情報からなりうるので、大量のデータを必要としうる。特に、境界情報は、メッシュ全体の重要な部分を占める。したがって、そのようなコンテンツを保存し、かつ送信するために効率的な圧縮技術が必要となる。2Dアトラスサンプリングベースの方法のフレームワークでは、1つの重要な手順は、デコーダ側でサンプリングされた頂点と境界頂点から接続性情報を推測することである。これは、デコーディングプロセスの主要な部分であり、本開示の焦点である。
【0016】
この開示では、動的メッシュ圧縮のためのいくつかの方法が提案される。これらの方法は、個別に適用することも、任意の組合せの形態で適用することもできる。また、この方法は、メッシュのフレームが1つだけ存在するか、またはメッシュのコンテンツが時間の経過とともに変化しない静的メッシュにも適用できる。
【0017】
提案した方法は、別々に使用されてもよく、任意の順序で組み合わされてもよい。さらに、方法(または実施形態)、エンコーダ、およびデコーダの各々は、処理回路(例えば、1つもしくは複数のプロセッサ、または1つもしくは複数の集積回路)によって実装されてもよい。一例では、1つまたは複数のプロセッサは、非一時的コンピュータ可読媒体に記憶されたプログラムを実行する。
【0018】
接続性情報は、デコーダ側の各チャートの境界頂点とサンプリングされた頂点から推測されうる。推測された三角形の方向(時計回りまたは反時計回り)は、シーケンスヘッダ、スライスヘッダなどの高レベル構文で、すべてのチャートに対して通知されうるか、またはエンコーダとデコーダによって固定され(想定され)うる。推測された三角形の方向も、チャートごとに異なる方法で通知されうる。
【0019】
再構成されたメッシュは、元のメッシュとは異なる接続性を有することができる。例えば、元のメッシュは三角形メッシュであるが、再構成されたメッシュはポリゴンメッシュ(例えば、四角形メッシュ)であってもよい。
【0020】
図1および図2を参照すると、本開示のエンコーディング構造およびデコーディング構造を実施するための本開示の一実施形態が説明される。
【0021】
図1は、本開示の一実施形態による通信システム100の簡略ブロック図を例示している。システム100は、ネットワーク150を通じて相互接続された少なくとも2つの端末110、120を含むことができる。データの単方向送信の場合、第1の端末110は、ネットワーク150を通じて他の端末120に送信するために、ローカルロケーションでメッシュデータを含みうるビデオデータをコーディングすることができる。第2の端末120は、ネットワーク150から他方の端末のコーディングされたビデオデータを受信し、コーディングされたデータをデコーディングし、復元されたビデオデータを表示しうる。単方向データ送信は、メディア提供用途などで一般的でありうる。
【0022】
図1は、例えばビデオ会議中に発生しうるコーディングされたビデオの双方向伝送をサポートするために設けられた端末130、140の第2のペアを例示している。データの双方向伝送の場合、各端末130、140は、ネットワーク150を介して他の端末に伝送するために、ローカルロケーションでキャプチャされたビデオデータをコーディングすることができる。各端末130、140はまた、他の端末によって伝送されたコーディングされたビデオデータを受信することができ、コーディングされたデータをデコーディングすることができ、復元されたビデオデータをローカル表示装置に表示することができる。
【0023】
図1では、端末110~140は、例えば、サーバ、パーソナルコンピュータ、およびスマートフォン、および/または任意の他のタイプの端末であってもよい。例えば、端末(110~140)は、ラップトップコンピュータ、タブレットコンピュータ、メディアプレーヤ、および/または専用ビデオ会議機器であってもよい。ネットワーク150は、例えば、有線および/またはワイヤレスの通信ネットワークを含む、端末110~140の間でコーディングされたビデオデータを伝達する任意の数のネットワークを表す。通信ネットワーク150は、回線交換および/またはパケット交換チャネルでデータを交換しうる。代表的なネットワークは、電気通信ネットワーク、ローカルエリアネットワーク、ワイドエリアネットワークおよび/またはインターネットを含む。本考察の目的では、ネットワーク150のアーキテクチャおよびトポロジーは、本明細書で以下に説明されない限り、本開示の動作にとって重要ではない場合がある。
【0024】
図2は、開示された主題の用途の一例として、ストリーミング環境でのビデオエンコーダおよびデコーダの配置を示している。開示の主題は、例えば、ビデオ会議、デジタルテレビ、CD、DVD、メモリスティックなどを含むデジタルメディアへの圧縮ビデオの記憶などを含む他のビデオ対応用途で使用されてもよい。
【0025】
図2に示すように、ストリーミングシステム200は、ビデオソース201およびエンコーダ203を含むキャプチャサブシステム213を含むことができる。ストリーミングシステム200は、少なくとも1つのストリーミングサーバ205および/または少なくとも1つのストリーミングクライアント206をさらに含むことができる。
【0026】
ビデオソース201は、例えば、3Dメッシュおよび3Dメッシュと関連付けられたメタデータを含むストリーム202を作成しうる。ビデオソース201は、例えば、3Dセンサ(例えば、深度センサ)または3Dイメージング技術(例えば、(1つもしくは複数の)デジタルカメラ)と、3Dセンサまたは3Dイメージング技術から受信されたデータを使用して3Dメッシュを生成するように構成されたコンピューティングデバイスとを含んでもよい。サンプルストリーム202は、エンコーディングされたビデオビットストリームと比較して高いデータ量を有する可能性があり、ビデオソース201に結合されたエンコーダ203によって処理されうる。エンコーダ203は、以下でより詳細に説明されるように、開示の主題の態様を可能にするかまたは実装するために、ハードウェア、ソフトウェア、またはそれらの組合せを含んでもよい。エンコーダ203はまた、エンコーディングされたビデオビットストリーム204をさらに生成しうる。エンコーディングされたビデオビットストリーム204は、圧縮されていないストリーム202と比較して低いデータ量を有する可能性があり、後で使用するためにストリーミングサーバ205上に記憶されうる。1つまたは複数のストリーミングクライアント206は、ストリーミングサーバ205にアクセスして、エンコーディングされたビデオビットストリーム204のコピーでありうるビデオビットストリーム209を取り出しうる。
【0027】
ストリーミングクライアント206は、ビデオデコーダ210およびディスプレイ212を含みうる。ビデオデコーダ210は、例えば、エンコーディングされたビデオビットストリーム204の着信コピーである、ビデオビットストリーム209をデコーディングし、ディスプレイ212または他のレンダリングデバイス(図示せず)上にレンダリングされうる発信ビデオサンプルストリーム211を作成することができる。一部のストリーミングシステムでは、ビデオビットストリーム204、209は、特定のビデオコーディング/圧縮規格に従ってエンコーディングされうる。
【0028】
図3は、エンコーダおよびデコーダを使用して動的メッシュ圧縮およびメッシュ再構成するためのフレームワーク300の例示的な図である。入力メッシュの各フレームは、トラッキング、再メッシュ化、パラメータ化、ボクセル化などの一連の操作によって前処理されうる。これらの操作は、エンコーダのみで行われる可能性があり、これは、デコーディングプロセスの一部ではあり得ないことを意味する。その後、2D UVアトラスを用いてメッシュを取得でき、メッシュの各頂点には、2Dアトラス上の1つまたは複数の関連するUV座標がある。次に、メッシュは、2Dアトラス上でサンプリングすることによって、占有マップ、ジオメトリマップ、および属性マップを含む複数のマップに変換されうる。次に、これらの2Dマップは、HEVC、VVC、AV1、AVS3などのビデオ/画像コーデックによってコーディングされうる。デコーダ側では、メッシュが、デコーディングされた2Dマップから再構成されうる。再構成されたメッシュには、後処理およびフィルタリングも適用されうる。他のメタデータが、3Dメッシュ再構成を目的としてデコーダ側にシグナリングされてもよい。占有マップは、各チャートの境界頂点がシグナリングされる場合にデコーダ側から推測されうる。
【0029】
図3に見られるように、フレームワーク300は、エンコーダ301およびデコーダ351を含むことができる。エンコーダ301は、1つまたは複数の入力メッシュ305、UVアトラスを有する1つまたは複数のメッシュ310、チャート境界情報315、ジオメトリマップ320、および属性マップ325を含むことができる。デコーダ351は、デコーディングされたチャート境界335、デコーディングされたジオメトリマップ340、デコーディングされた属性マップ345、および再構成されたメッシュ360を含むことができ、フィルタリングされたメッシュ365を含むことができる。
【0030】
本開示の一態様によれば、入力メッシュ305は、1つまたは複数のフレームを含むことができ、1つまたは複数のフレームはそれぞれ、一連の動作によって前処理され、UVアトラスを有するメッシュ310を生成するために使用されうる。一例として、前処理動作は、トラッキング、パラメータ化、再メッシュ化、ボクセル化などを含みうるが、これらに限定されなくてもよい。いくつかの実施形態では、前処理動作は、エンコーダ側でのみ実行され、デコーダ側では実行されなくてもよい。
【0031】
UVアトラスを有するメッシュ310は、2Dメッシュとすることができる。UVアトラスを有する2Dメッシュは、メッシュの各頂点が2Dアトラス上のUV座標に関連しうるメッシュとすることができる。UVアトラスを有するメッシュ310は、サンプリングに基づいて、処理され、複数のマップに変換されうる。一例として、UVアトラス310は、UVアトラスを有する2Dメッシュをサンプリングすることに基づいて処理され、占有マップ、ジオメトリマップ、および属性マップに変換されうる。ジオメトリマップ320、および属性マップ325は、適切なコーデック(例えば、HVEC、VVC、AV1など)を使用してエンコーディングされ、デコーダに送信されうる。いくつかの実施形態では、メタデータ(例えば、接続性情報など)もデコーダに送信されうる。
【0032】
一態様によれば、デコーダ351は、エンコーダからコーディングされた占有マップ、ジオメトリマップ、および属性マップを受信することができる。デコーダ351は、本明細書に記載の実施形態に加えて、チャート境界情報、ジオメトリマップ、および属性マップをデコーディングするために適切な技術および方法を使用することができる。一実施形態では、デコーダ351は、デコーディングされたチャート境界335、デコーディングされたジオメトリマップ340、およびデコーディングされた属性マップ345を生成してもよい。入力メッシュ305は、デコーディングされたチャート境界情報335、デコーディングされたジオメトリマップ340、およびデコーディングされた属性マップ345に基づいて、1つまたは複数の再構成フィルタおよび技術を使用して再構成されたメッシュ360に再構成されうる。再メッシュ化、パラメータ化、トラッキング、ボクセル化などを含むが、これらに限定されないポストフィルタリング技術が、再構成されたメッシュ360に適用されて、フィルタリングされたメッシュ365を生成することができる。
【0033】
いくつかの実施形態では、3Dメッシュは、いくつかのセグメント(またはパッチ/チャート)に分割することができる。各セグメントは、そのジオメトリ、属性、および接続性情報と関連付けられた接続された頂点のセットを含むことができる。図4に例示されるように、UVパラメータ化プロセスは、メッシュセグメントを2D UVアトラス内の2Dチャート上にマッピングする。メッシュセグメント内の各頂点には、2D UVアトラス内の2D UV座標が割り当てられる。2Dチャート内の頂点は、それらの3D対応頂点として接続構成要素を形成する。各頂点のジオメトリ、属性、および接続性情報は、それらの3D対応物からも同様に継承されうる。
【0034】
3Dメッシュセグメントはまた、複数の別々の2Dチャートにもマッピングされうる。この場合、3Dクラウドにおける頂点は、2D UVアトラスの複数の頂点に対応しうる。図5に示されるように、同じ3Dメッシュセグメントは、2D UVアトラスにおいて、単一のチャートの代わりに2 2Dチャートにマッピングされる。3D頂点vおよびvは、それぞれ2つの2D対応関係を有する。
【0035】
3Dメッシュの一般的な2D UVアトラスは、図6に示されるように、複数のチャートで構成されてよく、各チャートは、それらの3Dジオメトリ、属性、および接続性情報に関連付けられた複数の(通常は3つ以上の)頂点を含んでもよい。
【0036】
境界頂点は、2D UV空間内に定義される。図7に示されるように、塗りつぶされた頂点は、接続構成要素(パッチ/チャート)の境界エッジ上にあるため、境界頂点である。境界エッジは、そのエッジが1つの三角形にのみに現れるかどうかをチェックすることによって決定されてよい。境界頂点の次の情報は重要であり、ビットストリームでシグナリングされる必要がある。
・ジオメトリ情報、つまり3D xyz座標。
・2D UV座標。
【0037】
図5に示されるように、3Dの境界頂点が2D UVアトラスの複数の頂点に対応する場合については、3D XYZから2D UVへのマッピングは、1対複数であってもよい。したがって、UV-to-XYZ(またはUV2XYZと呼ばれる)インデックスは、マッピング関数を示すためにシグナリングされうる。UV2XYZは、各2D UV頂点を3D xyz頂点に対応させるインデックスの1D配列である。
【0038】
境界UV座標が可逆的にコーディングされている場合、境界上に(同じUV座標をもつ)重複する頂点は存在しない。次に、外部境界頂点および内部のサンプリングされた頂点を含むすべての頂点の集合に対して三角形分割法を実行することができる。図8に示されるように、BからBまでの外部頂点(より大きなサイズで示される)は、可逆的にコーディングされた境界頂点であり、内部頂点(より小さなサイズで示される)は、サンプリングされた頂点である。
【0039】
内部頂点は、元のUV空間内の外部境界頂点によって定義されるポリゴン内部の頂点である。元のUV空間とは、すべての境界UV座標がサンプリングレート(サンプリングステップサイズ)によってスケーリングされ、オフセットによってシフトされた後に再構成されることを意味する。サンプリングされたすべての頂点は、サンプリング位置の規則的なグリッド上にあるが、境界頂点にはサンプリング位置に対してオフセットがある場合がある。
【0040】
いくつかの実施形態では、内部のサンプリングされた頂点は、境界エッジ上または境界頂点上にある頂点を含まない。
【0041】
頂点(境界頂点およびサンプリングされた頂点を含む)間の接続性を生成するには、任意の三角形分割法が適用されうる。ただし、境界頂点およびサンプリングされた頂点には異なる三角形分割法を使用できる。
【0042】
一実施形態では、サンプリングされた位置の4つの近傍点ごとに、占有点の数が3以上である場合、4つの点の間の三角形の接続性は、特定の規則によって推測することができる。例えば、図9に示されるように、4点のうち3点が占有されている場合、それらを直接接続して三角形を形成でき、4つの点がすべて占有されている場合、それらは2つの三角形を形成できる。異なる数の近接点に異なる規則が適用されうる。この実施形態では、再構成されたメッシュは、三角形メッシュである。
【0043】
別の実施形態では、4つの近接点がすべて占有されると、四角形メッシュが再構成される。
【0044】
第3の実施形態では、再構成されたメッシュはハイブリッド型であってもよく、例えば、メッシュフレーム内のいくつかの領域が三角形メッシュを生成し、他の領域は四角形メッシュを生成する。接続性タイプは、シーケンスヘッダやスライスヘッダなどの高レベルシンタックスでシグナリングされうる。
【0045】
いくつかの実施形態では、明示的にシグナリングすることにより、接続性情報も再構成されうる。暗黙的規則によってポリゴンが復元されることができない場合、エンコーダはビットストリーム内の接続性情報をシグナリングすることができる。ポリゴンの境界に応じてなど、明示的シグナリングのオーバーヘッドを低減するための任意の手段が使用されうる。図10に示されるように、三角形の接続性情報は、暗黙的規則(図9に示される)と明示的なシグナリングの両方によって再構成される。
【0046】
いくつかの実施形態では、境界UV座標は、非可逆的な方法でコーディングされうる。図11は、境界UV座標がサンプリングされた位置に存在する場合を示しており、その場合、サンプリングされた位置からのオフセットは、まったくシグナリングされない。別のケースでは、量子化後にオフセットがシグナリングされる場合があり、その場合、境界UV座標には、依然としてサンプリングされた位置からのオフセットが含まれている可能性がある。この場合は、図8に示されるケースと同様のものとなりうるが、オフセットが量子化されているため、境界UV位置は、元の位置と異なる場合がある。
【0047】
可逆的境界UVの場合と同様に、非可逆的な境界UVの場合でも、頂点(境界頂点とサンプリングされた頂点を含む)間の接続性を生成するために任意の三角形分割法を適用できる。境界頂点とサンプリングされた頂点に対して異なる三角形分割法を使用することもできる。
【0048】
ただし、非可逆コーディングにより、境界UV座標が重複する場合がある。このような場合、同じUV座標をもついくつかの境界頂点が存在する可能性がある。この場合に対処するためにいくつかの特別な手順が適用される場合があり、そうでない場合は、三角形分割法に問題が生じる可能性がある。B、B、…BN-1をデコーダ側から再構成された境界UV座標のセットとする。Nは、チャート内の境界頂点の数である。非可逆圧縮により、セット内に重複した頂点が存在する可能性がある。
【0049】
いくつかの実施形態では、重複した頂点が最初にセットから削除され、重複した頂点のインデックスが記録される。重複を削除した後の一意の境界頂点のセットをB’、B’、...BM-1’とし、ここで、M(M≦N)は一意の境界頂点の数である。I、I、...、IK-1を重複頂点のインデックスであるとし、ここで、I∈{0,1,...,N-1}である。K=N-Mは、重複の数である。次に、一意の境界頂点B’、B’、...BM-1’が、内部サンプリングされた頂点とともに、三角形分割アルゴリズムに入力される。任意の三角形分割アルゴリズムが適用されうる。次に、別の方法で重複した境界頂点に対して追加の三角形を形成することができる。具体的には、重複した境界頂点ごとに、その近傍の境界頂点と重複された頂点自体に基づいて新しい三角形が構成される。
【0050】
一実施形態では、重複した頂点の各I(i=0、1、…、K-1)について、頂点間
【数1】
で新しい三角形分割が構成される。
【0051】
別の実施形態では、重複した頂点の各I(i=0、1、…、K-1)について、新しい三角形分割が頂点間
【数2】
で構成される。
【0052】
別の実施形態では、重複した頂点の各I(i=0、1、…、K-1)について、新しい三角形分割が頂点間
【数3】
で構成される。
【0053】
図11に示されるように、非可逆圧縮のため、再構成された境界頂点は、(図8に示されるような)元の境界頂点とは異なる可能性がある。テクスチャマップは、再構成された境界UV座標に合わせて更新されうる。この目的のために、様々な補間法が適用されうる。すべての三角形を元の位置から新しい位置にワープすることによって、テクスチャマップを再充填することができる。一実施形態では、少なくとも境界頂点を有する三角形にのみこの操作を適用することができる。
【0054】
図12に示されるように、チャートには外部境界ポリゴンに穴がある場合があり、この場合、外部境界ポリゴンは、外部境界頂点(B、B、…、B)によって定義される。穴は、内部境界頂点(図12のB、B、…B13)によって通知され、再構成されうる。内部境界頂点は、外部境界頂点がどのようにコーディングされるかに関係なく、可逆的または非可逆的のいずれかでコーディングされうる。図12では、外部境界頂点は可逆的にコーディングされ、内部境界頂点は非可逆的にコーディングされる。
【0055】
デコーダ側では、任意の三角形分割法を適用できるが、内部境界頂点がポリゴンの内側に穴を生成することを目的としており、これは、穴の内側に構成された三角形は存在しないことを意味する。
【0056】
図13は、動的メッシュ圧縮のための境界情報を用いた三角形分割法の例示的なプロセス1300のフローチャートである。いくつかの実装形態では、図13の1つまたは複数のプロセスブロックは、上述した要素のいずれかによって実行されうる。
【0057】
図13に示されるように、プロセス1300は、コーディングされたビデオビットストリームをエンコーダから受信することを含みうる(ブロック1310)。
【0058】
さらに図13に示されるように、プロセス1300は、コーディングされたビデオビットストリームからメッシュを取り出すことを含むことができる(ブロック1320)。
【0059】
さらに図13に示されるように、プロセス1300は、メッシュの1つまたは複数の頂点を三角形分割することを含むことができ、1つまたは複数の頂点は、メッシュの境界上またはメッシュの内部に位置する(ブロック1330)。
【0060】
さらに図13に示されるように、プロセス1300は、1つまたは複数の頂点の三角形分割を使用して、1つまたは複数の頂点間の接続性情報を決定することを含むことができる(ブロック1340)。
【0061】
さらに図13に示されるように、プロセス1300は、接続性情報に基づいて1つまたは複数の境界UV座標を再構成することを含むことができる(ブロック1350)。
【0062】
図13はプロセス1300のブロック例を示しているが、いくつかの実装形態では、プロセス1300は図13に示されているものと比較して、追加のブロックを含んでもよいし、より少数のブロックを含んでもよいし、異なるブロックを含んでもよいし、異なる配置のブロックを含んでもよい。追加的または代替的に、プロセス1300のブロックのうちの2つ以上が並列に実行されてもよい。
【0063】
上述された技術は、コンピュータ可読命令を使用するコンピュータソフトウェアとして実装され、1つまたは複数のコンピュータ可読媒体に物理的に記憶されてもよい。例えば、図14は、本開示の特定の実施形態を実装するために適したコンピュータシステム1400を示している。
【0064】
コンピュータソフトウェアは、コンピュータ中央処理装置(CPU)、グラフィックスプロセッシングユニット(GPU)などによって直接、または解釈、マイクロコード実行などを介して実行されうる命令を含むコードを作成するためにアセンブリ、コンパイル、リンクなどのメカニズムを施されうる、任意の適切な機械コードまたはコンピュータ言語を使用してコーディングされうる。
【0065】
命令は、例えばパーソナルコンピュータ、タブレットコンピュータ、サーバ、スマートフォン、ゲーミングデバイス、およびモノのインターネットデバイスなどを含む様々なタイプのコンピュータまたはその構成要素上で実行されうる。
【0066】
コンピュータシステム1400について図14に示される構成要素は、例であり、本開示の実施形態を実装するコンピュータソフトウェアの使用範囲または機能に関する制限を示唆することを意図するものではない。構成要素の構成は、コンピュータシステム1400の非限定的な実施形態に示されている構成要素のいずれか1つ、または構成要素の組合せに関して、依存性を有するものとも、要件を有するものとも解釈されてはならない。
【0067】
コンピュータシステム1400は、特定のヒューマンインターフェース入力デバイスを含みうる。このようなヒューマンインターフェース入力デバイスは、例えば、触覚入力(キーストローク、スワイプ、データグローブの動きなど)、オーディオ入力(音声、拍手など)、視覚入力(ジェスチャなど)、嗅覚入力(図示せず)を介した、1人以上の人間ユーザによる入力に応答しうる。ヒューマンインターフェースデバイスはまた、音声(発話、音楽、周囲音など)、画像(スキャン画像、静止画像カメラから取得される写真画像など)、ビデオ(二次元ビデオ、立体ビデオを含む三次元ビデオなど)など、人間による意識的な入力に必ずしも直接関係ない特定のメディアを取り込むために使用されうる。
【0068】
入力ヒューマンインターフェースデバイスは、キーボード1401、マウス1402、トラックパッド1403、タッチスクリーン1410、データグローブ、ジョイスティック1405、マイク1406、スキャナ1407、カメラ1408のうちの1つまたは複数(それぞれの1つのみを図示)を含んでもよい。
【0069】
コンピュータシステム1400は、特定のヒューマンインターフェース出力デバイスも含みうる。このようなヒューマンインターフェース出力デバイスは、例えば、触覚出力、音、光、および匂い/味を介して、1人以上の人間のユーザの感覚を刺激しうる。そのようなヒューマンインターフェース出力デバイスは、触覚出力デバイス(例えば、タッチスクリーン1410、データグローブ、またはジョイスティック1405による触覚フィードバックであるが、入力デバイスとして機能しない触覚フィードバックデバイスも存在しうる)を含みうる。例えば、そのようなデバイスは、音声出力デバイス(スピーカ1409、ヘッドホン(図示せず)など)、視覚出力デバイス(CRTスクリーン、LCDスクリーン、プラズマスクリーン、OLEDスクリーンを含むスクリーン1410など、それぞれタッチスクリーン入力機能の有無にかかわらず、それぞれ触覚フィードバック機能の有無にかかわらず、そのいくつかはステレオグラフィック出力などの手段を通して、2次元視覚出力または3次元を超える出力を出力できるものもある、仮想現実メガネ(図示せず)、ホログラフィックディスプレイ、およびスモークタンク(図示せず))、およびプリンタ(図示せず)でありうる。
【0070】
コンピュータシステム1400はまた、CD/DVDまたは同様の媒体1421を有するCD/DVD ROM/RW 1420を含む光学媒体、サムドライブ1422、リムーバブルハードドライブまたはソリッドステートドライブ1423、テープおよびフロッピーディスクなどのレガシー磁気媒体(図示せず)、セキュリティドングルなどの特殊なROM/ASIC/PLDベースのデバイス(図示せず)など、人間がアクセス可能な記憶デバイスおよびそれらに関連する媒体を含みうる。
【0071】
当業者はまた、本開示の主題に関連して使用される「コンピュータ可読メディア」という用語が、伝送メディア、搬送波、または他の一時的信号を包含しないことを理解すべきである。
【0072】
コンピュータシステム1400はまた、1つまたは複数の通信ネットワークへのインターフェースを含みうる。ネットワークは、例えば、無線、有線、光であってもよい。ネットワークはさらに、ローカル、広域、都市、車両および産業、リアルタイム、遅延耐性などであってよい。ネットワークの例には、Ethernetなどのローカルエリアネットワーク、無線LAN、GSM、3G、4G、5G、LTEなどを含むセルラネットワーク、ケーブルテレビ、衛星テレビおよび地上波テレビを含むテレビの有線または無線ワイドエリアデジタルネットワーク、CANBusを含む車両用および産業用などが含まれる。特定のネットワークは、一般に、特定の汎用データポートまたは周辺バス1449(例えば、コンピュータシステム1400のUSBポートなど)に接続された外部ネットワークインターフェースアダプタを必要とし、他のものは一般に、以下に記載されるようにシステムバスへの接続によってコンピュータシステム1400のコアに統合される(例えば、PCコンピュータシステムへのイーサネットインターフェースまたはスマートフォンコンピュータシステムへのセルラネットワークインターフェース)。これらのネットワークのいずれかを使用して、コンピュータシステム1400は、他のエンティティと通信しうる。そのような通信は、単方向の受信のみ(例えば、放送TV)、単方向送信のみ(例えば、特定のCANbusデバイスへのCANbus)、または双方向、例えばローカルエリアまたはワイドエリアデジタルネットワークを使用する他のコンピュータシステムへの通信でありうる。そのような通信は、クラウドコンピューティング環境1455への通信を含みうる。特定のプロトコルおよびプロトコルスタックは、上記で説明したように、それらのネットワークおよびネットワークインターフェースのそれぞれで使用されうる。
【0073】
前述のヒューマンインターフェースデバイス、人間がアクセス可能な記憶デバイス、およびネットワークインターフェース1454は、コンピュータシステム1400のコア1440に取り付けられうる。
【0074】
コア1440は、1つまたは複数の中央処理装置(CPU)1441、グラフィックスプロセッシングユニット(GPU)1442、フィールドプログラマブルゲートエリア(FPGA)1443の形式の専用プログラマブル処理ユニット、特定のタスク用のハードウェアアクセラレータ1444などを含んでもよい。これらのデバイスは、読み取り専用メモリ(ROM)1445、ランダムアクセスメモリ1446、ユーザがアクセスすることができない内部ハードドライブ、SSDなどの内部大容量ストレージ1447とともに、システムバス1448を介して接続されうる。いくつかのコンピュータシステムでは、システムバス1448は、追加のCPU、GPUなどによる拡張を可能にするために、1つまたは複数の物理プラグの形態でアクセス可能でありうる。周辺デバイスは、コアのシステムバス1448に直接取り付けられても、周辺バス1449を介して取り付けられてもよい。周辺バス用のアーキテクチャには、PCI、USBなどが含まれる。グラフィックスアダプタ1450は、コア1440に含まれてもよい。
【0075】
CPU1441、GPU1442、FPGA1443、およびアクセラレータ1444は、組み合わさって、前述のコンピュータコードを構成しうる特定の命令を実行してもよい。そのコンピュータコードは、ROM1445またはRAM1446に記憶されてもよい。RAM1446には暫定的なデータも記憶されうるが、永続データは、例えば、内部大容量ストレージ1447に記憶されうる。メモリデバイスのいずれかへの高速記憶および取り出しは、1つまたは複数のCPU1441、GPU1442、大容量ストレージ1447、ROM1445、RAM1446などと密接に関連付けられうるキャッシュメモリの使用によって可能とされてもよい。
【0076】
コンピュータ可読媒体は、様々なコンピュータ実施動作を実施するためのコンピュータコードを有しうる。媒体およびコンピュータコードは、本開示の目的のために特別に設計および構成されたものであってもよいし、またはコンピュータソフトウェア技術の当業者に周知の利用可能な種類のものであってもよい。
【0077】
限定ではなく、例として、コンピュータシステム1400のアーキテクチャを有するコンピュータシステム、特にコア1440は、1つまたは複数の有形のコンピュータ可読媒体で具現化されたソフトウェアを実行するプロセッサ(CPU、GPU、FPGA、アクセラレータなどを含む)の結果として機能を提供することができる。そのようなコンピュータ可読媒体は、上記で紹介されたようなユーザアクセス可能な大容量ストレージ、ならびにコア内部の大容量ストレージ1447やROM 1445などの非一時的な性質のものであるコア1440の特定のストレージと関連付けられた媒体であってもよい。本開示の様々な実施形態を実装するソフトウェアは、そのようなデバイスに記憶され、コア1440によって実行されてもよい。コンピュータ可読媒体は、特定のニーズに応じて、1つまたは複数のメモリデバイスまたはチップを含みうる。ソフトウェアは、コア1440、具体的にはその中のプロセッサ(CPU、GPU、FPGAなどを含む)に、RAM1446に記憶されたデータ構造を定義すること、およびソフトウェアによって定義されたプロセスに従ってそのようなデータ構造を修正することを含む、本明細書で説明された特定のプロセスまたは特定のプロセスの特定の部分を実行させうる。加えて、または代替として、コンピュータシステムは、ソフトウェアの代わりに、またはソフトウェアとともに本明細書で説明された特定のプロセスまたは特定のプロセスの特定の部分を実行するように動作しうる回路(例えば、アクセラレータ1444)に配線されるかまたは他の方法で具体化されたロジックの結果として機能を提供してもよい。ソフトウェアへの参照は、ロジックを包含してもよく、適宜その逆も同様である。コンピュータ可読媒体への言及は、実行のためのソフトウェアを記憶する回路(集積回路(IC)など)、実行のためのロジックを具体化する回路、またはこれらの両方を包含しうる。本開示は、ハードウェアとソフトウェアの任意の適切な組合せを包含する。
【0078】
本開示は、いくつかの非限定的な実施形態を説明しているが、本開示の範囲内にある変更、順列、および様々な代替的な同等物が存在する。したがって、当業者は、本明細書に明示的に示されていないかまたは記載されていないが、本開示の原理を具現化し、したがって本開示の趣旨および範囲内にある多数のシステムおよび方法を考案することができることが理解されよう。
【符号の説明】
【0079】
100 通信システム
150 通信ネットワーク
200 ストリーミングシステム
201 ビデオソース
202 サンプルストリーム
203 エンコーダ
204 ビデオビットストリーム
205 ストリーミングサーバ
206 ストリーミングクライアント
209 ビデオビットストリーム
210 ビデオデコーダ
211 発信ビデオサンプルストリーム
212 ディスプレイ
213 キャプチャサブシステム
300 フレームワーク
301 エンコーダ
305 入力メッシュ
310 メッシュ
315 チャート境界情報
320 ジオメトリマップ
325 属性マップ
335 チャート境界
340 ジオメトリマップ
345 属性マップ
351 デコーダ
360 メッシュ
365 メッシュ
1300 プロセス
1400 コンピュータシステム
1401 キーボード
1402 マウス
1403 トラックパッド
1405 ジョイスティック
1406 マイク
1407 スキャナ
1408 カメラ
1409 スピーカ
1410 スクリーン
1421 媒体
1422 サムドライブ
1423 ソリッドステートドライブ
1440 コア
1441 中央処理装置(CPU)
1442 グラフィックスプロセッシングユニット(GPU)
1443 フィールドプログラマブルゲートエリア(FPGA)
1444 ハードウェアアクセラレータ
1445 読み取り専用メモリ(ROM)
1446 ランダムアクセスメモリ
1447 大容量ストレージ
1448 システムバス
1449 周辺バス
1450 グラフィックスアダプタ
1454 ネットワークインターフェース
1455 クラウドコンピューティング環境
図1
図2
図3
図4
図5
図6
図7
図8
図9
図10
図11
図12
図13
図14
【手続補正書】
【提出日】2024-03-07
【手続補正2】
【補正対象書類名】特許請求の範囲
【補正対象項目名】全文
【補正方法】変更
【補正の内容】
【特許請求の範囲】
【請求項1】
デコーダ内の少なくとも1つのプロセッサによって実行される方法であって、前記方法は、
エンコーダからコーディングされたビデオビットストリームを受信するステップと、
前記コーディングされたビデオビットストリームから、ボリュームオブジェクトの表面を記述する複数のポリゴンを含むメッシュを取り出すステップと、
前記メッシュの1つまたは複数の頂点を三角形分割するステップであって、前記1つまたは複数の頂点は、前記メッシュの境界上または前記メッシュの内部に位置する、ステップと、
前記1つまたは複数の頂点の前記三角形分割を使用して、前記1つまたは複数の頂点間の接続性情報を推測するステップと、
前記接続性情報に基づいて1つまたは複数の境界UV座標を再構成するステップとを含む、方法。
【請求項2】
前記メッシュの前記境界上に位置する前記1つまたは複数の頂点は、可逆的にコーディングされる、請求項1に記載の方法。
【請求項3】
前記メッシュの前記内部に位置する前記1つまたは複数の頂点は、サンプリングされる、請求項1に記載の方法。
【請求項4】
前記メッシュ内の複数のサンプリングされた近傍点の間の接続性情報を推測するステップをさらに含む、請求項1に記載の方法。
【請求項5】
前記再構成された境界UV座標は、1つまたは複数の三角形メッシュおよび1つまたは複数の四角形メッシュを生成するハイブリッドメッシュを形成する、請求項1に記載の方法。
【請求項6】
前記メッシュの前記境界上に位置する前記1つまたは複数の頂点は、非可逆的にコーディングされる、請求項1に記載の方法。
【請求項7】
1つまたは複数の重複した頂点をセットから除去して1セットの一意の境界頂点を生成するステップと、
前記1つまたは複数の重複した頂点の1つまたは複数のインデックスを記録するステップと、
サンプリングされた前記メッシュの前記内部に位置する前記頂点とともに、前記1セットの一意の境界頂点を三角形分割するステップと
をさらに含む、請求項6に記載の方法。
【請求項8】
請求項1から7のいずれか一項に記載の方法を実行するように構成された、装置。
【請求項9】
少なくとも1つのプロセッサによって実行されると、前記少なくとも1つのプロセッサに、請求項1から7のいずれか一項に記載の方法を実行させる命令を備える、コンピュータプログラム。
【国際調査報告】