IP Force 特許公報掲載プロジェクト 2022.1.31 β版

知財求人 - 知財ポータルサイト「IP Force」

▶ ソニー株式会社の特許一覧 ▶ ソニー コーポレイション オブ アメリカの特許一覧

特表2025-532407オルソアトラス(ORTHOATLAS):正投影を使用した動的メッシュのテクスチャマップ生成
<>
  • 特表-オルソアトラス(ORTHOATLAS):正投影を使用した動的メッシュのテクスチャマップ生成 図1
  • 特表-オルソアトラス(ORTHOATLAS):正投影を使用した動的メッシュのテクスチャマップ生成 図2
  • 特表-オルソアトラス(ORTHOATLAS):正投影を使用した動的メッシュのテクスチャマップ生成 図3
  • 特表-オルソアトラス(ORTHOATLAS):正投影を使用した動的メッシュのテクスチャマップ生成 図4
  • 特表-オルソアトラス(ORTHOATLAS):正投影を使用した動的メッシュのテクスチャマップ生成 図5
  • 特表-オルソアトラス(ORTHOATLAS):正投影を使用した動的メッシュのテクスチャマップ生成 図6
  • 特表-オルソアトラス(ORTHOATLAS):正投影を使用した動的メッシュのテクスチャマップ生成 図7
  • 特表-オルソアトラス(ORTHOATLAS):正投影を使用した動的メッシュのテクスチャマップ生成 図8
  • 特表-オルソアトラス(ORTHOATLAS):正投影を使用した動的メッシュのテクスチャマップ生成 図9
  • 特表-オルソアトラス(ORTHOATLAS):正投影を使用した動的メッシュのテクスチャマップ生成 図10
  • 特表-オルソアトラス(ORTHOATLAS):正投影を使用した動的メッシュのテクスチャマップ生成 図11
  • 特表-オルソアトラス(ORTHOATLAS):正投影を使用した動的メッシュのテクスチャマップ生成 図12
< >
(19)【発行国】日本国特許庁(JP)
(12)【公報種別】公表特許公報(A)
(11)【公表番号】
(43)【公表日】2025-09-29
(54)【発明の名称】オルソアトラス(ORTHOATLAS):正投影を使用した動的メッシュのテクスチャマップ生成
(51)【国際特許分類】
   G06T 15/04 20110101AFI20250919BHJP
【FI】
G06T15/04
【審査請求】有
【予備審査請求】未請求
(21)【出願番号】P 2025520073
(86)(22)【出願日】2023-09-29
(85)【翻訳文提出日】2025-04-07
(86)【国際出願番号】 IB2023059792
(87)【国際公開番号】W WO2024074961
(87)【国際公開日】2024-04-11
(31)【優先権主張番号】63/378,565
(32)【優先日】2022-10-06
(33)【優先権主張国・地域又は機関】US
(31)【優先権主張番号】18/114,905
(32)【優先日】2023-02-27
(33)【優先権主張国・地域又は機関】US
(81)【指定国・地域】
(71)【出願人】
【識別番号】000002185
【氏名又は名称】ソニーグループ株式会社
(71)【出願人】
【識別番号】504257564
【氏名又は名称】ソニー コーポレイション オブ アメリカ
(74)【代理人】
【識別番号】100092093
【弁理士】
【氏名又は名称】辻居 幸一
(74)【代理人】
【識別番号】100109070
【弁理士】
【氏名又は名称】須田 洋之
(74)【代理人】
【識別番号】100067013
【弁理士】
【氏名又は名称】大塚 文昭
(74)【代理人】
【識別番号】100141553
【弁理士】
【氏名又は名称】鈴木 信彦
(74)【代理人】
【識別番号】100151987
【弁理士】
【氏名又は名称】谷口 信行
(72)【発明者】
【氏名】グラジオッシ ダニーロ
(57)【要約】
正投影を使用したテクスチャマップの生成は、高速かつ効率的に実行される。ここでは、テクスチャマップを生成するための方法であって、その所要時間を大幅に短縮するとともに、マップが時間内の異なるフレームのコンテンツ間の相関関係を利用できるようにする方法を説明する。テクスチャマッピングは、ボリュームコンテンツの自動生成のために、又は動的メッシュのより効率的な圧縮のために使用することができる。ここで説明するテクスチャマップ生成は、正投影を使用してテクスチャアトラスを生成する方法を含む。正投影の新しいストレッチメトリック(stretch metric)について説明し、マージアルゴリズムは、三角形を単一のパッチに最適にクラスタ化するように考案される。更に、サイズ及び時間的安定性を最適化しようとするメッシュパッチのために、パッキング技術を使用することができる。
【選択図】図1
【特許請求の範囲】
【請求項1】
デバイスの非一時的メモリにプログラムされた方法であって、
動的メッシュ情報からパッチを生成するステップと、
正投影を使用して、テクスチャアトラスに前記パッチをパッキングするステップと、
を含むことを特徴とする方法。
【請求項2】
動的メッシュ情報から前記パッチを生成するステップは、
隣接する三角形のリストを生成することと、
三角形の特性を計算することと、
近隣の三角形を追加することと、
頂点の遮蔽をチェックすることと、
表面の遮蔽をチェックすることと、
を更に含むことを特徴とする、請求項1に記載の方法。
【請求項3】
前記隣接する三角形のリストを生成することは、三角形と頂点を共有する三角形を前記リストに追加することを含むことを特徴とする、請求項2に記載の方法。
【請求項4】
前記隣接する三角形のリストを生成することは、三角形と辺を共有する三角形を前記リストに追加することを含むことを特徴とする、請求項2に記載の方法。
【請求項5】
前記三角形の特性を計算することは、各三角形の法線及び表面積を計算することを含むことを特徴とする、請求項2に記載の方法。
【請求項6】
法線が最も頻繁な向きと最も良く位置合わせされ、パッチに追加されていないシード三角形を選択するステップを更に含むことを特徴とする、請求項2に記載の方法。
【請求項7】
前記方法は、計算されたコストに基づいて前記パッチをマージするステップを更に含み、前記計算されたコストは、前記パッチの周囲長及びオルソストレッチ(ortho stretch)値に基づくことを特徴とする、請求項2に記載の方法。
【請求項8】
正投影を使用して前記テクスチャアトラスに前記パッチをパッキングするステップは、フレームスケーリング、パッチの向き、及び時間的安定化を実装することを含むことを特徴とする、請求項1に記載の方法。
【請求項9】
装置であって、
アプリケーションを記憶するための非一時的メモリであって、前記アプリケーションは、
動的メッシュ情報からパッチを生成し、
正投影を使用して、テクスチャアトラスに前記パッチをパッキングする、
ためのものである、非一時的メモリと、
前記メモリに結合されて、前記アプリケーションを処理するように構成されるプロセッサと、
を含むことを特徴とする装置。
【請求項10】
動的メッシュ情報から前記パッチを生成することは、
隣接する三角形のリストを生成することと、
三角形の特性を計算することと、
近隣の三角形を追加することと、
頂点の遮蔽をチェックすることと、
表面の遮蔽をチェックすることと、
を更に含むことを特徴とする、請求項9に記載の装置。
【請求項11】
前記隣接する三角形のリストを生成することは、三角形と頂点を共有する三角形を前記リストに追加することを含むことを特徴とする、請求項10に記載の装置。
【請求項12】
前記隣接する三角形のリストを生成することは、三角形と辺を共有する三角形を前記リストに追加することを含むことを特徴とする、請求項10に記載の装置。
【請求項13】
前記三角形の特性を計算することは、各三角形の法線及び表面積を計算することを含むことを特徴とする、請求項10に記載の装置。
【請求項14】
前記アプリケーションは、法線が最も頻繁な向きと最も良く位置合わせされ、パッチに追加されていないシード三角形を選択するように更に構成されることを特徴とする、請求項10に記載の装置。
【請求項15】
前記アプリケーションは、計算されたコストに基づいて前記パッチをマージするように更に構成され、前記計算されたコストは、前記パッチの周囲長及びオルソストレッチ値に基づくことを特徴とする、請求項10に記載の装置。
【請求項16】
正投影を使用して前記テクスチャアトラスに前記パッチをパッキングすることは、フレームスケーリング、パッチの向き、及び時間的安定化を実装することを含むことを特徴とする、請求項9に記載の装置。
【請求項17】
システムであって、
3次元コンテンツを取得するための1又は2以上のカメラと、
動的メッシュ情報からパッチを生成し、
正投影を使用して、テクスチャアトラスに前記パッチをパッキングする、
ように構成されるエンコーダと、
を含むことを特徴とするシステム。
【請求項18】
動的メッシュ情報から前記パッチを生成することは、
隣接する三角形のリストを生成することと、
三角形の特性を計算することと、
近隣の三角形を追加することと、
頂点の遮蔽をチェックすることと、
表面の遮蔽をチェックすることと、
を更に含むことを特徴とする、請求項17に記載のシステム。
【請求項19】
前記隣接する三角形のリストを生成することは、三角形と頂点を共有する三角形を前記リストに追加することを含むことを特徴とする、請求項18に記載のシステム。
【請求項20】
前記隣接する三角形のリストを生成することは、三角形と辺を共有する三角形を前記リストに追加することを含むことを特徴とする、請求項18に記載のシステム。
【請求項21】
前記三角形の特性を計算することは、各三角形の法線及び表面積を計算することを含むことを特徴とする、請求項18に記載のシステム。
【請求項22】
前記エンコーダは、法線が最も頻繁な向きと最も良く位置合わせされ、パッチに追加されていないシード三角形を選択するように更に構成されることを特徴とする、請求項18に記載のシステム。
【請求項23】
前記エンコーダは、計算されたコストに基づいて前記パッチをマージするように更に構成され、前記計算されたコストは、前記パッチの周囲長及びオルソストレッチ値に基づくことを特徴とする、請求項18に記載のシステム。
【請求項24】
正投影を使用して前記テクスチャアトラスに前記パッチをパッキングすることは、フレームスケーリング、パッチの向き、及び時間的安定化を実装することを含むことを特徴とする、請求項17に記載のシステム。
【発明の詳細な説明】
【技術分野】
【0001】
〔関連出願の相互参照〕
本出願は、2022年10月6日に出願された「オルソアトラス:正投影を使用した動的メッシュのテクスチャマップ生成(ORTHOATLAS: TEXTURE MAP GENERATION FOR DYNAMIC MESHES USING ORTHOGRAPHIC PROJECTIONS)」という名称の米国仮特許出願第63/378,565号の米国特許法第119条に基づく優先権を主張するものであり、この出願は、全ての目的に対してその全体が引用により本明細書に組み込まれる。
【0002】
本発明は、3次元グラフィックスに関する。より具体的には、本発明は、正投影を使用してテクスチャマップを生成することに関する。
【背景技術】
【0003】
近年、3Dから2Dへの投影に基づいて、ポイントクラウドなどのボリュームコンテンツを圧縮する新しい方法が標準化されつつある。V3C(視覚ボリュームビデオベースの圧縮)としても知られるこの方法は、3Dボリュームデータをいくつかの2Dパッチにマッピングし、更にパッチをアトラス画像に配置し、その後、ビデオエンコーダで符号化する。アトラス画像は、ポイントのジオメトリ、それぞれのテクスチャ、及びポイントクラウド再構築のためにどの位置を考慮すべきかを示す占有マップに対応する。
【0004】
2017年、MPEGは、ポイントクラウドの圧縮のための提案募集(CfP)を実施した。いくつかの提案の評価の後、現在、MPEGは、ポイントクラウド圧縮のための2つの異なる技術、すなわち、3Dネイティブコーディング技術(オクツリー及び同様のコーディング方法に基づく)、又は3Dから2Dへの投影後に従来のビデオコーディングを行うことを検討している。動的3Dシーンの場合、MPEGは、パッチ表面モデリング、3Dから2D画像へのパッチの投影、及びHEVCなどのビデオエンコーダによる2D画像のコーディングに基づいて、テストモデルソフトウェア(TMC2)を使用している。この方法は、ネイティブ3Dコーディングよりも効率的であることが判明しており、許容できる品質で競争力のあるビットレートを実現することができる。
【0005】
投影ベースの方法(ビデオベースの方法、又はV-PCCとしても知られる)による3Dポイントクラウドのコーディングが成功したため、この標準の将来のバージョンでは、3Dメッシュなどの更なる3Dデータを含むことが予想される。しかしながら、この標準の現在のバージョンは、接続されていないポイントのセットの送信にのみ適しているため、3Dメッシュ圧縮で必要とされるようなポイントの接続性を送信する機構がない。
【0006】
V-PCCの機能をメッシュに拡張するための方法も提案されている。1つの可能な方法は、V-PCCを使用して頂点を符号化し、次に、TFAN又はEdgebreakerなどのメッシュ圧縮方法を使用して接続性を符号化することである。この方法の制限は、頂点から生成されるポイントクラウドがまばらではなく、投影後に効率的に符号化することができるように、元のメッシュが密でなければならないことである。更に、頂点の順序は接続性のコーディングに影響を及ぼすため、メッシュの接続性を再編成するための異なる方法が提案されている。まばらなメッシュを符号化するための代替の方法は、RAWパッチデータを使用して、3Dの頂点の位置を符号化することである。RAWパッチは(x,y,z)を直接符号化するので、この方法では、全ての頂点がRAWデータとして符号化され、一方、接続性は、前述のような同様のメッシュ圧縮方法によって符号化される。RAWパッチにおいて、頂点は任意の好ましい順序で送信することができるため、接続性符号化から生成される順序を使用することができることに留意されたい。この方法は、まばらなポイントクラウドを符号化することができるが、RAWパッチは、3Dデータを符号化するのに効率的ではなく、この方法から、三角形の面の属性などの更なるデータが欠落している場合がある。
【0007】
MicrosoftのUVAtlasは、最先端の自動テクスチャマップ生成であるが、かなりの時間がかかり、ローカルフレームに対してのみ最適化を行う。V-PCCは、正投影を使用してパッチを生成するが、ポイントクラウドのみを対象としているため、メッシュのパッチ生成には対応していない。
【発明の概要】
【発明が解決しようとする課題】
【0008】
正投影を使用したテクスチャマップの生成は、高速かつ効率的に実行される。本明細書では、テクスチャマップを生成するための方法であって、その所要時間を大幅に短縮するとともに、マップが時間内の異なるフレームのコンテンツ間の相関関係を利用できるようにする方法を説明する。テクスチャマッピングは、ボリュームコンテンツの自動生成のために、又は動的メッシュのより効率的な圧縮のために使用することができる。本明細書で説明するテクスチャマップ生成は、正投影を使用してテクスチャアトラスを生成する方法を含む。正投影の新しいストレッチメトリック(stretch metric)について説明し、マージアルゴリズムは、三角形を単一のパッチに最適にクラスタ化するように考案される。更に、サイズ及び時間的安定性を最適化しようとするメッシュパッチのために、パッキング技術を使用することができる。
【課題を解決するための手段】
【0009】
一態様では、デバイスの非一時的メモリにプログラムされた方法は、動的メッシュ情報からパッチを生成するステップと、正投影を使用して、テクスチャアトラスに前記パッチをパッキングするステップと、を含む。動的メッシュ情報から前記パッチを生成するステップは、隣接する三角形のリストを生成することと、三角形の特性を計算することと、近隣の三角形を追加することと、頂点の遮蔽をチェックすることと、表面の遮蔽をチェックすることと、を更に含む。前記隣接する三角形のリストを生成することは、三角形と頂点を共有する三角形を前記リストに追加することを含む。前記隣接する三角形のリストを生成することは、三角形と辺を共有する三角形を前記リストに追加することを含む。前記三角形の特性を計算することは、各三角形の法線及び表面積を計算することを含む。前記方法は、法線が最も頻繁な向きと最も良く位置合わせされ、パッチに追加されていないシード三角形を選択するステップを更に含む。前記方法は、計算されたコストに基づいて前記パッチをマージするステップを更に含み、前記計算されたコストは、前記パッチの周囲長及びオルソストレッチ(ortho stretch)値に基づく。正投影を使用して前記テクスチャアトラスに前記パッチをパッキングするステップは、フレームスケーリング、パッチの向き、及び時間的安定化を実装することを含む。
【0010】
別の態様では、装置は、アプリケーションを記憶するための非一時的メモリであって、前記アプリケーションは、動的メッシュ情報からパッチを生成し、正投影を使用して、テクスチャアトラスに前記パッチをパッキングする、ためのものである、非一時的メモリと、前記メモリに結合されて、前記アプリケーションを処理するように構成されるプロセッサと、を含む。動的メッシュ情報から前記パッチを生成することは、隣接する三角形のリストを生成することと、三角形の特性を計算することと、近隣の三角形を追加することと、頂点の遮蔽をチェックすることと、表面の遮蔽をチェックすることと、を更に含む。前記隣接する三角形のリストを生成することは、三角形と頂点を共有する三角形を前記リストに追加することを含む。前記隣接する三角形のリストを生成することは、三角形と辺を共有する三角形を前記リストに追加することを含む。前記三角形の特性を計算することは、各三角形の法線及び表面積を計算することを含む。前記アプリケーションは、法線が最も頻繁な向きと最も良く位置合わせされ、パッチに追加されていないシード三角形を選択するように更に構成される。前記アプリケーションは、計算されたコストに基づいて前記パッチをマージするように更に構成され、前記計算されたコストは、前記パッチの周囲長及びオルソストレッチ値に基づく。正投影を使用して前記テクスチャアトラスに前記パッチをパッキングすることは、フレームスケーリング、パッチの向き、及び時間的安定化を実装することを含む。
【0011】
別の態様では、システムは、3次元コンテンツを取得するための1又は2以上のカメラと、動的メッシュ情報からパッチを生成し、正投影を使用して、テクスチャアトラスに前記パッチをパッキングする、ように構成されるエンコーダと、を含む。動的メッシュ情報から前記パッチを生成することは、隣接する三角形のリストを生成することと、三角形の特性を計算することと、近隣の三角形を追加することと、頂点の遮蔽をチェックすることと、表面の遮蔽をチェックすることと、を更に含む。前記隣接する三角形のリストを生成することは、三角形と頂点を共有する三角形を前記リストに追加することを含む。前記隣接する三角形のリストを生成することは、三角形と辺を共有する三角形を前記リストに追加することを含む。前記三角形の特性を計算することは、各三角形の法線及び表面積を計算することを含む。前記エンコーダは、法線が最も頻繁な向きと最も良く位置合わせされ、パッチに追加されていないシード三角形を選択するように更に構成される。前記エンコーダは、計算されたコストに基づいて前記パッチをマージするように更に構成され、前記計算されたコストは、前記パッチの周囲長及びオルソストレッチ値に基づく。正投影を使用して前記テクスチャアトラスに前記パッチをパッキングすることは、フレームスケーリング、パッチの向き、及び時間的安定化を実装することを含む。
【図面の簡単な説明】
【0012】
図1】いくつかの実施形態によるテクスチャパラメータ化の図である。
図2】いくつかの実施形態による隣接三角形分析の図である。
図3】いくつかの実施形態による三角形の特性を計算する図である。
図4】いくつかの実施形態によるシードを選択する図である。
図5】いくつかの実施形態による接続されたコンポーネントの異なるセットの図である。
図6】いくつかの実施形態によるオルソストレッチを実行する図である。
図7】いくつかの実施形態によるオルソストレッチの結果を示す図である。
図8】いくつかの実施形態によるパッキングの図である。
図9】いくつかの実施形態によるフレームスケーリングの画像を示す図である。
図10】いくつかの実施形態によるパッチの向きの画像を示す図である。
図11】いくつかの実施形態による時間的安定化の画像を示す図である。
図12】いくつかの実施形態による正投影を使用したテクスチャマップ生成方法を実装するように構成される例示的なコンピュータ装置のブロック図である。
【発明を実施するための形態】
【0013】
メッシュは、通常、ボリュームの表面を表すポリゴンのセットで構成されている。メッシュの表面特性(例えば、色特性)を表す効率的な方法は、3D表面の特性を2D表面にマッピングするテクスチャアトラスを生成することである。しかしながら、3D表面を2Dにマッピングすることは簡単な問題ではなく、MicrosoftのUVAtlasなどの最先端の方法では、メッシュ内の適切なカットを見つけ、表面調和関数(surface harmonics)を使用してマッピングするために、時間のかかる最適化が行われる。最新の国際ポイントクラウド圧縮規格では、正投影を使用してポイントクラウドのテクスチャマップ画像が生成されている。テクスチャマップ画像は簡単に生成できるが、テクスチャマップ画像はポイントクラウドのみに使用されるため、メッシュに存在する接続構造は考慮されない。本明細書で説明する方法は、V-PCC規格で使用されているものと同様に、正投影を使用するメッシュのテクスチャ画像を生成することができる。テクスチャマッピングは、ボリュームコンテンツの自動生成のために使用することができるか、又は動的メッシュのより効率的な圧縮のために使用することができる。
【0014】
本明細書で説明するテクスチャマップ生成は、正投影を使用してテクスチャアトラスを生成する方法を含む。正投影の新しいストレッチメトリックについて説明し、マージアルゴリズムは、三角形を単一のパッチに最適にクラスタ化するように考案される。更に、サイズ及び時間的安定性を最適化しようとするメッシュパッチのために、パッキング技術を使用することができる。
【0015】
正投影を使用したテクスチャマップ生成は、パッチ生成及びパッチパッキングを含む。パッチ生成は、接続されたコンポーネント(例えば、辺/頂点を共有する三角形)を使用したシード選択と、正投影の投影歪み測定であるオルソストレッチと、オルソストレッチ及びパッチの周囲長を使用したレート歪みベースのマージアルゴリズムとを含む。パッチパッキングは、フレーム/パッチのスケーリング、パッチの回転、及び時間的位置合わせを含む。
【0016】
図1に、いくつかの実施形態によるテクスチャパラメータ化の図を示す。ステップ100において、パッチを生成する。パッチが生成された後、ステップ102において、パッチをパッキングする。例えば、パッチは、テクスチャアトラスにパッキングされる。
【0017】
パッチを生成することは、ステップ110において接続されたコンポーネントを生成することと、ステップ130において投影することと、を含む。
【0018】
接続されたコンポーネントを生成することは、ステップ112において、隣接する三角形のリストを生成することと、ステップ114において、各三角形について、三角形の特性を計算することと、ステップ116において、シード(三角形)を選択することと、ステップ118において、基準に応じて、隣接する三角形から近隣の三角形を追加することと、全ての隣接する三角形を確認した後、パッチに追加できない三角形がある場合は、ステップ116において、異なるシード(三角形)を用いてプロセスを再開することと、三角形が残っていない場合は、ステップ120において、パッチをマージして、接続された三角形の大きな表面を生成することと、を含む。投影が実行され、これは、ステップ132において、頂点の遮蔽をチェックすることと、ステップ134において、表面の遮蔽をチェックすることと、を含む。頂点の遮蔽又は表面の遮蔽がある場合は、三角形がパッチから削除され、異なるパッチに含められる。
【0019】
図2に、いくつかの実施形態による隣接三角形分析の図を示す。三角形200は、多くの隣接する三角形及び近隣の三角形を有する。三角形の近隣は、単一の頂点を共有する(params.useVertexCriteria=true)か、又は辺を共有する(params.useVertexCriteria=false)ことによって定義することができる。隣接する三角形とは、指定された三角形と少なくとも1つの頂点を共有する三角形である。例えば、三角形1~15{T1、...、T15}は全て、三角形200と頂点を共有する。近隣の三角形は、三角形と辺を共有する。例えば、三角形4、10、及び14{T4、T10、及びT14}は、三角形200と辺を共有する。隣接する三角形及び近隣の三角形のリストは、三角形ごとに保持することができる。境界を保持するために、フラグを含めることもできる。
【0020】
図3に、いくつかの実施形態による三角形の特性を計算する図を示す。各三角形について、いくつかの特性が計算される(例えば、3Dでの法線及び表面積)。三角形の表面積及び法線は、投影された面積から導出することができる。
【0021】
図4に、いくつかの実施形態によるシードを選択する図を示す。最も頻繁な向きは、三角形のカテゴリのヒストグラムをチェックすることによって取得される。params.bUseSeedHistogram=trueの場合、シードは、法線が最も頻繁な向きと最も良く位置合わせされ、接続されたコンポーネントに追加されていない三角形である。params.bUseSeedHistogram=falseの場合、シードは、最初の利用可能な三角形である(例えば、まだ接続されたコンポーネントではない)。
【0022】
近隣の三角形をリストに追加するために、次の基準、すなわち、三角形のカテゴリが接続されたコンポーネントの向きと同じかどうか、最後に挿入された法線と現在の法線との間の角度が特定の閾値より小さいかどうか、パッチの面積が総面積の一部より小さいかどうか、及び三角形の数が閾値より小さいかどうかがチェックされる。いくつかの実施形態では、上記の基準が全て満たされている場合にのみ、近隣の三角形がリストに追加される。
【0023】
図5に、いくつかの実施形態による接続されたコンポーネントの異なるセットの図を示す。
【0024】
マージ関数は、接続されたコンポーネントの周囲長及びオルソストレッチ(例えば、正投影による伸縮)に基づいて、コストに応じて近隣の接続されたコンポーネントをマージする。マージアルゴリズムは、接続されたコンポーネントの順序付きリストを生成することによって開始する。リストは、1)三角形の数が最も少ない、2)向きと最も良く位置合わせされる平均法線(三角形の面積で重み付け)の順に並べられる。各接続されたコンポーネントは、コストCOST(Mi)=L2(Mi)+λPERIMETER(Mi)から始まる。ここで、Miは接続されたコンポーネント、Lはレート歪み、λはレート歪みと周囲長との間の重みを提供するパラメータである。λが0の場合、周囲長はコストで考慮されない。λが非常に高い値の場合、コストでは周囲長のみが考慮され、レート歪みは無関係になる。この例を更に進めると、使用可能なビットが非常に少ない場合、歪みはそれほど重要ではなく、λに非常に大きな値が使用される。品質が非常に重要である場合、λは0又は非常に小さくなり、コストを最小限に抑えるために、歪みが最小限に抑えられる。
【0025】
リストが空でない場合、次のステップが実行される:
リストの最上位要素(Mi)が削除される;
近隣の三角形候補のリスト(
が取得される。ここで、
は、Miと辺/頂点を共有する接続されたコンポーネントのリストである);
各近隣の候補について:
マージコストを計算する:COST(Mi+Mj)=L2(Mi+Mj)+λPERIMETER(Mi);
近隣の三角形(少なくとも1つの辺を共有する接続されたコンポーネント)のうちの1つとのマージ操作によってコストが低減される場合(COST(Mi+Mj)<COST(Mi)+COST(Mj))、結合コストを最小化する近隣の三角形を選択する:
近隣の三角形がマージ対象として選択された場合は、接続されたコンポーネント(Mi→Mj)を更新し、リストを並べ替える。
【0026】
図6に、いくつかの実施形態によるオルソストレッチを実行する図を示す。本明細書では、3D空間の点を2D空間にマッピングする関数(例えば、投影関数)について説明する。3D空間の点を2D空間の点に接続するのは、重心補間である。重心補間では、投影された三角形の面積を使用して重みを生成し、重みを使用して表面上の任意の点を導出する。これは、任意の方向(例えば、x、y、z)で実行することができる。例えば、頂点を点pに接続することによって、三角形600(及びその他の三角形)内に三角形を生成することができる。その後、投影された空間内のそれらの三角形の面積を補間することによって、3D空間の点pの値を取得することができる。値qは、頂点q1、q2、q3の点を投影された三角形の面積で重み付けすることによって取得することができる。以下の方程式を解くことによって、面積の比率が求められ、2D空間の投影に基づいて3D空間の点が再生成される。
XY(p)=q
ここで、

上記を踏まえると、関数のヤコビアンを取得することが可能である。ヤコビアンを固有値と固有ベクトルに分解することによって、ストレッチ(例えば、3D空間から2D空間への三角形のサイズの縮小)を決定することができる。ストレッチは、3D空間と2D空間の面積の比率である。いくつかの実施形態では、面積が事前に計算されているため、ストレッチを事前に又は迅速に計算することができる。

最大(Γ)及び最小(Υ)特異値:
ここで、
三角形ストレッチL2 XY、L2 XZ、L2 ZY
メッシュL2ストレッチ:
ここで、
【0027】
図7に、いくつかの実施形態によるオルソストレッチの結果を示す。元のメッシュ700には、2351個の接続されたコンポーネント(例えば、最初は個々の三角形)があり、周囲長は186071、ストレッチは1.0978である。メッシュ702では、近隣の三角形とのクラスタ化が実行され(追加の分析なし)、接続されたコンポーネントは251個になり、周囲長は50721.7に減少したが、ストレッチはわずかに増加して1.14037になった。メッシュ704では、マージも実装されているため、接続されたコンポーネントは55個あり、周囲長は28935.2であるが、ストレッチは1.6506である。接続されたコンポーネントが55個あるため、必要なビット数は大幅に少なくなる。メッシュ706では、投影分析が実行され(例えば、接続されたコンポーネントが重ならないようにする)、その結果、68個の接続されたコンポーネント、31455.1の周囲長、及び1.69315のストレッチが生成される。投影により、投影情報によってテクスチャ座標を決定することができる。
【0028】
図8に、いくつかの実施形態によるパッキングの図を示す。パッチ(例えば、接続されたコンポーネント)が生成された後、パッチはビデオ内の2D画像に配置され、その後、ビデオが符号化される。パッチは、表面に収まるようにスケーリングされる(例えば、フレームスケーリング)。各パッチに対して、パッチスケーリングが実装される。
【0029】
図9に、いくつかの実施形態によるフレームスケーリングの画像を示す。初期スケーリングは、テクスチャマップ表面の大部分を占める投影を生成するために使用される。例えば、2Kx2K表面の場合、パッチは、可能な限り最も効率的に表面を占めるように調整される。パッチのサイズは、表面全体を占めるように最大化される。パッキングが成功しない場合は、投影された接続されたコンポーネントに更に多くの空間を提供するために、スケーリングが10%(又は別の値)低減される。
ここで、調整(adjustment)はスケーリング値(例えば、10%)、BBは境界ボックス900の寸法、高さ(height)はテクスチャマップ902の高さ、occResは占有解像度である。占有解像度は、ピクセル単位ではなく、16x16(又は別のサイズ)のブロックの解像度である。
【0030】
例示的な画像では、BBYが最大寸法であるため、テクスチャマップの高さは、BBYの高さに近いか又は同じに設定される。しかしながら、パッチが大きすぎてテクスチャマップに収まらない場合がある。パッチが大きすぎる場合は、全てのパッチが10%縮小される。縮小されたパッチがまだテクスチャマップに収まらない場合は、パッチが更に10%縮小され、パッチがテクスチャマップに収まるまでプロセスがループする。
【0031】
各パッチについて、パッチのスケール、向き、及び位置を調整することができる。
【0032】
パッチスケーリングは、フレームスケーリングに加えて実行されて、パッチごとにテクスチャサイズを適合させることができる。パッチスケーリングにより、詳細度の高い特定の領域(例えば、顔)でより多くのテクスチャ空間を使用できるようになる。例示的な実装では、params.bPatchScaling=trueの場合、パッチの初期サイズが2倍になる(又は別の量だけ増加する)。パッチをパッキングできない場合は、そのサイズが10%縮小される。合計サイズ縮小がパッチのサイズの50%を超える場合、パッキングは失敗したとみなされ、新しいフレームスケーリングが計算される。
【0033】
図10に、いくつかの実施形態によるパッチの向きの画像を示す。V-PCCと同様に、パッチは、テクスチャアトラスドメイン内で回転して、より良いフィットを得ることができる。しかしながら、いくつかの実施形態では、三角形の曲がりを維持するために、0°、90°、180°、及び270°の回転のみが許可される。例えば、画像1000は、テクスチャマップ内の回転されていないパッチを示し、画像1002は、回転されたパッチを示す。
【0034】
図11に、いくつかの実施形態による時間的安定化の画像を示す。一致するパッチは、投影方向と、3Dでの両パッチの交差部分の体積と3Dでの両パッチの結合部分の体積との比率とをチェックすることによって決定される。一致したパッチは、一致したパッチと同じ位置(U0、V0)、同じ向き(O)、及び同じスケール(S)を有する。画像1100は、時間的安定化のないテクスチャマップを示し、画像1102は、時間的安定化のあるテクスチャマップを示す。
【0035】
テクスチャマップ座標は、次の変換を適用することによって導出することができる。
ここで、


ここで、

【0036】
図12に、いくつかの実施形態による正投影を使用したテクスチャマップ生成方法を実装するように構成される例示的なコンピュータ装置のブロック図を示す。コンピュータ装置1200を使用して、3Dコンテンツを含む画像及びビデオなどの情報を取得、記憶、計算、処理、通信及び/又は表示することができる。コンピュータ装置1200は、符号化/復号の態様のいずれかを実装することができる。一般に、コンピュータ装置1200を実装するのに適したハードウェア構造は、ネットワークインターフェイス1202、メモリ1204、プロセッサ1206、(単複の)I/Oデバイス1208、バス1210、及び記憶装置1212を含む。プロセッサの選択は、十分な速度を有する好適なプロセッサが選ばれる限り重要ではない。メモリ1204は、当該技術分野で公知の任意の従来のコンピュータメモリとすることができる。記憶装置1212は、ハードドライブ、CDROM、CDRW、DVD、DVDRW、高精細ディスク/ドライブ、超高精細ドライブ、フラッシュメモリカード又は他の任意の記憶装置を含むことができる。コンピュータ装置1200は、1又は2以上のネットワークインターフェイス1202を含むことができる。ネットワークインターフェイスの一例は、イーサネット又は他のタイプのLANに接続されるネットワークカードを含む。(単複の)I/Oデバイス1208は、キーボード、マウス、モニタ、スクリーン、プリンタ、モデム、タッチスクリーン、ボタンインターフェイス及び他のデバイスのうちの1又は2以上を含むことができる。正投影を使用したテクスチャマップ生成実装を実装するために使用される(単複の)正投影を使用したテクスチャマップ生成アプリケーション1230は、記憶装置1212及びメモリ1204に記憶されて、アプリケーションが通常処理されるように処理される可能性が高い。コンピュータ装置1200は、図12に示すより多い又は少ない構成要素を含むことができる。いくつかの実施形態では、正投影を使用したテクスチャマップ生成ハードウェア1220が含まれる。図12のコンピュータ装置1200は、正投影を使用したテクスチャマップ生成実装のためのアプリケーション1230及びハードウェア1220を含むが、正投影を使用したテクスチャマップ生成方法は、コンピュータ装置に、ハードウェア、ファームウェア、ソフトウェア又はそれらの任意の組み合わせとして実装することができる。例えば、いくつかの実施形態では、正投影を使用したテクスチャマップ生成アプリケーション1230は、メモリにプログラムされて、プロセッサを使用して実行される。別の例では、いくつかの実施形態において、正投影を使用したテクスチャマップ生成ハードウェア1220は、正投影を使用したテクスチャマップ生成方法を実装するように専用に設計されるゲートを含む、プログラムされたハードウェアロジックである。
【0037】
いくつかの実施形態では、(単複の)正投影を使用したテクスチャマップ生成アプリケーション1230は、いくつかのアプリケーション及び/又はモジュールを含む。いくつかの実施形態では、モジュールは、1又は2以上のサブモジュールも含む。いくつかの実施形態では、より少ない又は追加のモジュールを含むことができる。
【0038】
好適なコンピュータ装置の例は、パーソナルコンピュータ、ラップトップコンピュータ、コンピュータワークステーション、サーバ、メインフレームコンピュータ、ハンドヘルドコンピュータ、携帯情報端末、セルラ電話/携帯電話、スマート家電、ゲーム機、デジタルカメラ、デジタルカムコーダ、カメラ付き携帯電話、スマートフォン、携帯音楽プレーヤー、タブレットコンピュータ、モバイルデバイス、ビデオプレーヤー、ビデオディスクライター/プレーヤー(例えば、DVDライター/プレーヤー、高精細ディスクライター/プレーヤー、超高精細ディスクライター/プレーヤー)、テレビジョン、家庭用娯楽システム、拡張現実デバイス、仮想現実デバイス、スマートジュエリー(例えば、スマートウォッチ)、車両(例えば、自動運転車両)又は他の任意の好適なコンピュータ装置を含む。
【0039】
正投影を使用したテクスチャマップ生成方法を利用するために、デバイスは、3Dコンテンツ(例えば、ポイントクラウドコンテンツ)を取得又は受信する。正投影を使用したテクスチャマップ生成方法は、ユーザの援助によって又はユーザが関与することなく自動的に実装することができる。
【0040】
動作時、正投影を使用したテクスチャマップの生成は、高速かつ効率的に実行される。現在、テクスチャマップの生成は、マッピングの歪み及びテクスチャの継ぎ目を減らすために複雑な最適化に依拠している。しかしながら、このような手順はリアルタイムアプリケーションには適しておらず、通常はフレームごとに実行されるため、テクスチャマップ間の時間的な相関関係は利用されない。本明細書では、テクスチャマップを生成するための方法であって、その所要時間を大幅に短縮するとともに、マップが時間内の異なるフレームのコンテンツ間の相関関係を利用できるようにする方法を説明する。テクスチャマッピングは、ボリュームコンテンツの自動生成のために使用することができるか、又は動的メッシュのより効率的な圧縮のために使用することができる。
【0041】
オルソアトラス:正投影を使用した動的メッシュのテクスチャマップ生成のいくつかの実施形態
1.デバイスの非一時的メモリにプログラムされた方法であって、
動的メッシュ情報からパッチを生成するステップと、
正投影を使用して、テクスチャアトラスに前記パッチをパッキングするステップと、
を含む方法。
【0042】
2.動的メッシュ情報から前記パッチを生成するステップは、
隣接する三角形のリストを生成することと、
三角形の特性を計算することと、
近隣の三角形を追加することと、
頂点の遮蔽をチェックすることと、
表面の遮蔽をチェックすることと、
を更に含む、第1項に記載の方法。
【0043】
3.前記隣接する三角形のリストを生成することは、三角形と頂点を共有する三角形を前記リストに追加することを含む、第2項に記載の方法。
【0044】
4.前記隣接する三角形のリストを生成することは、三角形と辺を共有する三角形を前記リストに追加することを含む、第2項に記載の方法。
【0045】
5.前記三角形の特性を計算することは、各三角形の法線及び表面積を計算することを含む、第2項に記載の方法。
【0046】
6.法線が最も頻繁な向きと最も良く位置合わせされ、パッチに追加されていないシード三角形を選択するステップを更に含む、第2項に記載の方法。
【0047】
7.前記方法は、計算されたコストに基づいて前記パッチをマージするステップを更に含み、前記計算されたコストは、前記パッチの周囲長及びオルソストレッチ値に基づく、第2項に記載の方法。
【0048】
8.正投影を使用して前記テクスチャアトラスに前記パッチをパッキングするステップは、フレームスケーリング、パッチの向き、及び時間的安定化を実装することを含む、第1項に記載の方法。
【0049】
9.装置であって、
アプリケーションを記憶するための非一時的メモリであって、前記アプリケーションは、
動的メッシュ情報からパッチを生成し、
正投影を使用して、テクスチャアトラスに前記パッチをパッキングする、
ためのものである、非一時的メモリと、
前記メモリに結合されて、前記アプリケーションを処理するように構成されるプロセッサと、
を含む装置。
【0050】
10.動的メッシュ情報から前記パッチを生成することは、
隣接する三角形のリストを生成することと、
三角形の特性を計算することと、
近隣の三角形を追加することと、
頂点の遮蔽をチェックすることと、
表面の遮蔽をチェックすることと、
を更に含む、第9項に記載の装置。
【0051】
11.前記隣接する三角形のリストを生成することは、三角形と頂点を共有する三角形を前記リストに追加することを含む、第10項に記載の装置。
【0052】
12.前記隣接する三角形のリストを生成することは、三角形と辺を共有する三角形を前記リストに追加することを含む、第10項に記載の装置。
【0053】
13.前記三角形の特性を計算することは、各三角形の法線及び表面積を計算することを含む、第10項に記載の装置。
【0054】
14.前記アプリケーションは、法線が最も頻繁な向きと最も良く位置合わせされ、パッチに追加されていないシード三角形を選択するように更に構成される、第10項に記載の装置。
【0055】
15.前記アプリケーションは、計算されたコストに基づいて前記パッチをマージするように更に構成され、前記計算されたコストは、前記パッチの周囲長及びオルソストレッチ値に基づく、第10項に記載の装置。
【0056】
16.正投影を使用して前記テクスチャアトラスに前記パッチをパッキングすることは、フレームスケーリング、パッチの向き、及び時間的安定化を実装することを含む、第9項に記載の装置。
【0057】
17.システムであって、
3次元コンテンツを取得するための1又は2以上のカメラと、
動的メッシュ情報からパッチを生成し、
正投影を使用して、テクスチャアトラスに前記パッチをパッキングする、
ように構成されるエンコーダと、
を含むシステム。
【0058】
18.動的メッシュ情報から前記パッチを生成することは、
隣接する三角形のリストを生成することと、
三角形の特性を計算することと、
近隣の三角形を追加することと、
頂点の遮蔽をチェックすることと、
表面の遮蔽をチェックすることと、
を更に含む、第17項に記載のシステム。
【0059】
19.前記隣接する三角形のリストを生成することは、三角形と頂点を共有する三角形を前記リストに追加することを含む、第18項に記載のシステム。
【0060】
20.前記隣接する三角形のリストを生成することは、三角形と辺を共有する三角形を前記リストに追加することを含む、第18項に記載のシステム。
【0061】
21.前記三角形の特性を計算することは、各三角形の法線及び表面積を計算することを含む、第18項に記載のシステム。
【0062】
22.前記エンコーダは、法線が最も頻繁な向きと最も良く位置合わせされ、パッチに追加されていないシード三角形を選択するように更に構成される、第18項に記載のシステム。
【0063】
23.前記エンコーダは、計算されたコストに基づいて前記パッチをマージするように更に構成され、前記計算されたコストは、前記パッチの周囲長及びオルソストレッチ値に基づく、第18項に記載のシステム。
【0064】
24.正投影を使用して前記テクスチャアトラスに前記パッチをパッキングすることは、フレームスケーリング、パッチの向き、及び時間的安定化を実装することを含む、第17項に記載のシステム。
【0065】
本発明の構成及び動作の原理の理解を容易にするために、詳細内容を組み込んだ特定の実施形態に関して本発明を説明してきた。このような本明細書における特定の実施形態及びその詳細内容への言及は、本明細書に添付される特許請求の範囲を限定することを意図するものではない。特許請求の範囲によって規定される本発明の精神及び範囲から逸脱することなく、例示のために選択された実施形態に、他の様々な修正を行うことができることは、当業者に容易に理解されるであろう。
【符号の説明】
【0066】
100 パッチを生成
102 パッチをパッキング
110 接続されたコンポーネント
112 隣接する三角形
114 三角形の特性
116 シードを選択
118 近隣の三角形を追加
120 マージ
130 投影
132 頂点の遮蔽をチェック
134 表面の遮蔽をチェック
200 三角形
600 三角形
700 元のメッシュ
702 メッシュ
704 メッシュ
706 メッシュ
900 境界ボックス
902 テクスチャマップ
1000 画像
1002 画像
1100 画像
1102 画像
1200 コンピュータ装置
1202 ネットワークインターフェイス
1204 メモリ
1206 プロセッサ
1208 I/Oデバイス
1210 バス
1212 記憶装置
1220 正投影を使用したテクスチャマップ生成ハードウェア
1230 正投影を使用したテクスチャマップ生成アプリケーション
図1
図2
図3
図4
図5
図6
図7
図8
図9
図10
図11
図12
【国際調査報告】