IP Force 特許公報掲載プロジェクト 2022.1.31 β版

知財求人 - 知財ポータルサイト「IP Force」

▶ 浙江大学の特許一覧

特許7171087グラフ畳み込みネットワークに基づくメッシュ雑音除去方法
<>
  • 特許-グラフ畳み込みネットワークに基づくメッシュ雑音除去方法 図1
  • 特許-グラフ畳み込みネットワークに基づくメッシュ雑音除去方法 図2
  • 特許-グラフ畳み込みネットワークに基づくメッシュ雑音除去方法 図3
< >
(19)【発行国】日本国特許庁(JP)
(12)【公報種別】特許公報(B2)
(11)【特許番号】
(24)【登録日】2022-11-07
(45)【発行日】2022-11-15
(54)【発明の名称】グラフ畳み込みネットワークに基づくメッシュ雑音除去方法
(51)【国際特許分類】
   G06T 5/00 20060101AFI20221108BHJP
   G06T 17/20 20060101ALI20221108BHJP
【FI】
G06T5/00 705
G06T17/20 500
【請求項の数】 6
(21)【出願番号】P 2021107136
(22)【出願日】2021-06-28
(65)【公開番号】P2022045893
(43)【公開日】2022-03-22
【審査請求日】2021-06-28
(31)【優先権主張番号】202010939418.4
(32)【優先日】2020-09-09
(33)【優先権主張国・地域又は機関】CN
(73)【特許権者】
【識別番号】505072650
【氏名又は名称】浙江大学
【氏名又は名称原語表記】ZHEJIANG UNIVERSITY
(74)【代理人】
【識別番号】100128347
【弁理士】
【氏名又は名称】西内 盛二
(72)【発明者】
【氏名】沈 越凡
(72)【発明者】
【氏名】▲鄭▼ 友怡
【審査官】松永 隆志
(56)【参考文献】
【文献】中国特許出願公開第109658348(CN,A)
【文献】米国特許出願公開第2019/0096038(US,A1)
【文献】特開2020-115336(JP,A)
【文献】Diego Valsesia ほか2名,Deep Graph-Convolutional Image Denoising,IEEE Transactions on Image Processing ,2020年08月05日, Vol. 29,p.8226-8237
(58)【調査した分野】(Int.Cl.,DB名)
G06T 1/00-19/20
(57)【特許請求の範囲】
【請求項1】
グラフ畳み込みネットワークに基づくメッシュ雑音除去方法であって、以下のステップ1とステップ2を含み、
ステップ1では、雑音メッシュ内の各面に局所ブロックを生成しかつテンソル投票アルゴリズムを採用して局部ブロックを回転整列し、
ステップ2では、ステップ1で整列された局所ブロックをグラフに変換して示させ、トレーニングされたグラフ畳み込みニューラルネットワークに入力し、雑音のない法線方向を予測し、さらに予測された法線方向に基づいてメッシュモデルの頂点を更新し、雑音除去後のモデルを取得し、ここで、前記グラフ畳み込みニューラルネットワーク構造はL層EdgeConv、L層動的EdgeConv及びL層全結合(FC)層で構成される
ことを特徴とする方法。
【請求項2】
前記ステップ1が以下のサブステップ1.1~サブステップ1.3により実施され、
サブステップ1.1では、選択されたパッチ
に対して、その領域の面積の一定の割合に応じてバウンディングスフィアを画定し、バウンディングスフィア内の全てのパッチを該局所ブロック
中の面とし、
サブステップ1.2では、該局所ブロックにおける全ての面
に対する投票テンソル
を定義し、かつ特徴値及び単位特徴ベクトルを取得し、
サブステップ1.3では、サブステップ1.2で得られた特徴ベクトルに基づいて一つの回転行列Rを構築し、かつ
中の各小面の重心及び法線をR -1に乗算して新たなブロックデータ
を生成する
ことを特徴とする請求項1に記載のグラフ畳み込みネットワークに基づくメッシュ雑音除去方法。
【請求項3】
前記ステップ2が以下のサブステップ2.1~サブステップ2.4によりされ、
サブステップ2.1では、入力された画像に対して静的EdgeConvによる静的辺畳み込み処理を反復し、隣接面特徴を取得し、
サブステップ2.2では、サブステップ2.1で得られた結果に対して動的EdgeConvによる動的辺畳み込み処理を反復し、特徴空間における最も隣接する特徴面を取得し、
サブステップ2.3では、グラフ畳み込みの後、学習された特徴を一緒に接続し、全結合層を介して特徴をまとめ、
サブステップ2.4では、対称性プール化により最も主要な特徴を選択して法線方向を最終的に予測する
ことを特徴とする請求項1に記載のグラフ畳み込みネットワークに基づくメッシュ雑音除去方法。
【請求項4】
前記グラフ畳み込みニューラルネットワークのトレーニングデータセットは以下の方法で構築され、
テンソル投票アルゴリズムをデータセット中の無雑音モデルの各面に適用し、三つの特徴値λ、λ、λを取得し、特徴値に基づいて全てのデータにおける全てのモデルの面を「面」及び「辺」の二組に分け、それぞれブロックデータを収集してトレーニングデータセットを構築する
ことを特徴とする請求項1に記載のグラフ畳み込みネットワークに基づくメッシュ雑音除去方法。
【請求項5】
複数のカスケード接続されたグラフ畳み込みニューラルネットワークをトレーニングして雑音無しの法線方向を予測し、トレーニングするとき、カスケード接続されたネットワークの損失が低下しなくなるまで、前段のグラフ畳み込みニューラルネットワークに予測された法線方向を利用して雑音除去後のメッシュモデルを構築して新たなデータを生成することで次の段のグラフ畳み込みニューラルネットワークをトレーニングする
ことを特徴とする請求項1に記載のグラフ畳み込みネットワークに基づくメッシュ雑音除去方法。
【請求項6】
最終段のグラフ畳み込みニューラルネットワークにおいて、メッシュ上のバイラテラルフィルタ対の法線ベクトルにより反復最適化を行い、反復するたびに頂点を更新し、最終的に雑音除去後のメッシュモデルを取得する
ことを特徴とする請求項1に記載のグラフ畳み込みネットワークに基づくメッシュ雑音除去方法。
【発明の詳細な説明】
【技術分野】
【0001】
本発明はコンピュータグラフィックスの分野に属し、特にグラフ畳み込みネットワークに基づくメッシュ雑音除去方法に関する。
【背景技術】
【0002】
頂点位置又は面法線は本質的に3D信号であるため、メッシュ表面で雑音除去を行うタスクは2D画像に類似する。したがって、メッシュ雑音除去技術は画像における雑音除去技術に大きな示唆を受け、現在様々な低域通過及び特徴を保持するフィルタを導入してメッシュ雑音除去を行う。ここで、バイラテラルフィルタは最も広く適用されるフィルタの一つであるが、フィルタに基づく方法の一般的な欠点は、特徴が雑音により深刻に破壊されると、それら(特に弱い特徴)がこれらの方法で回復することが困難であることである。もう一つの方法は最適化されたメッシュ雑音除去方法に基づくことである。しかし仮定したメッシュのみを適用し、かつ異なる幾何学的特徴を有するメッシュに対して騒音モードをうまく要約することができない。
【0003】
これに対して、学習に基づく方法は基本的な特徴又は雑音モードに特定の仮説を与えず、かつ画像雑音除去に成功して適用される。しかし、画像とは異なり、3Dメッシュは一般的に不規則であるため、画像に基づく畳み込み演算は直接的に適用することができない。この問題を解決するために、本発明者らは新しい方法を提供し、不規則なメッシュブロックデータを直接グラフ畳み込みネットワークに入力する。パターン畳み込み演算により局部表面幾何学的図形に対して図形に基づく表示を行い、本発明者らのネットワークは他の従来の方法より雑音下源モデルの固有幾何学的特徴をよりよく捕捉することができる。
【0004】
グラフ畳み込みネットワーク(GCN)はユークリッド構造を処理するために導入される。GCNの早期動作は静的グラフ構造を必要とするため、変化トポロジを有するメッシュに拡張することができない。動的グラフ畳み込みの最新の研究によると、可変エッジはより良好に表現することができる。本発明者らの方法はブロックにおける静的グラフ構造及び畳み込み期間構造の動的グラフ構造を利用してブロックにおける幾何学的特徴を効果的に学習する。また他のいくつかはメッシュ開発の畳み込み操作であり、主に対象全体又は大型シーンを理解するために用いられ、かつ非常に深いネットワーク構造を必要とする。雑音除去作業はより局所ブロックに注目し、メッシュ面の双対空間に畳み込みを導入する。
【発明の概要】
【発明が解決しようとする課題】
【0005】
本発明はGCNネットワークに基づくメッシュ雑音除去方法を提供し、メッシュ面の双対空間に回転不変のグラフ表示を使用することにより、グラフ畳み込みにより効果的な特徴学習を実現する。同時に本発明のアーキテクチャにおける静的及び動的なグラフ畳み込み演算が直列接続されることにより、隣接ノードの間の有効明示的な構造特徴及び潜在的な暗黙的特徴を学習する。
【課題を解決するための手段】
【0006】
本発明は以下の技術的解決手段により実現される。
【0007】
グラフ畳み込みネットワークに基づくメッシュ雑音除去方法であって、以下のステップ1とステップ2を含み、
ステップ1では、雑音メッシュ内の各面に局所ブロックを生成しかつテンソル投票アルゴリズムを採用して局部ブロックを回転整列し、
ステップ2では、ステップ1で整列された局所ブロックをグラフに変換して示させ、トレーニングされたグラフ畳み込みニューラルネットワークに入力し、雑音のない法線方向を予測し、さらに予測された法線方向に基づいてメッシュモデルの頂点を更新し、雑音除去後のモデルを取得し、ここで、前記畳み込みニューラルネットワーク構造はL層EdgeConv、L層動的EdgeConv及びL層全結合(FC)層で構成される。
【0008】
さらに、 前記ステップ1が以下のサブステップ1.1~サブステップ1.3により実施され、
サブステップ1.1では、選択されたパッチ
に対して、その領域の面積の一定の割合に応じてバウンディングスフィアを画定し、バウンディングスフィア内の全てのパッチを該ブロック
中の面とし、
サブステップ1.2では、該ブロックにおける全ての面
に対する投票テンソル
を定義し、かつ特徴値及び単位特徴ベクトルを取得し、
サブステップ1.3では、サブステップ1.2で得られた特徴ベクトルに基づいて一つの回転行列Rを構築し、かつ
中の各小面の重心及び法線をR -1に乗算して新たなブロックデータ
を生成する。
【0009】
さらに、前記ステップ2が以下のサブステップ2.1~サブステップ2.4によりされ、
サブステップ2.1では、入力された画像に対して静的EdgeConvによる静的辺畳み込み処理を反復し、隣接面特徴を取得し、
サブステップ2.2では、サブステップ2.1で得られた結果に対して動的EdgeConvによる動的辺畳み込み処理を反復し、特徴空間における最も隣接する特徴面を取得し、
サブステップ2.3では、グラフ畳み込みの後、学習された特徴を一緒に接続し、全結合層を介して特徴をまとめ、
サブステップ2.4では、対称性プール化により最も主要な特徴を選択して法線方向を最終的に予測する。
【0010】
さらに、前記グラフ畳み込みニューラルネットワークのトレーニングデータセットは以下の方法で構築され、
テンソル投票アルゴリズムをデータセット中の無雑音モデルの各面に適用し、三つの特徴値λ、λ、λを取得し、特徴値に基づいて全てのデータにおける全てのモデルの面を「面」及び「辺」の二組に分け、それぞれブロックデータを収集してトレーニングデータセットを構築する。
【0011】
さらに、複数のカスケード接続されたグラフ畳み込みニューラルネットワークをトレーニングして雑音無しの法線方向を予測し、トレーニングするとき、カスケード接続されたネットワークの損失が低下しなくなるまで、前段のグラフ畳み込みニューラルネットワークに予測された法線方向を利用して雑音除去後のメッシュモデルを構築して新たなデータを生成することで次の段のグラフ畳み込みニューラルネットワークをトレーニングする。
【0012】
さらに、最終段のグラフ畳み込みニューラルネットワークにおいて、メッシュ上のバイラテラルフィルタ対の法線ベクトルにより反復最適化を行い、反復するたびに頂点を更新し、最終的に雑音除去後のメッシュモデルを取得する。
【発明の効果】
【0013】
本発明の突出寄与は以下のとおりである。
【0014】
本発明はGCN-Denoiser、グラフ畳み込みネットワーク(GCN)に基づく特徴保留のネットワーク雑音除去方法を提供する。従来の人為的な構造的特徴学習又はボクセルに基づく特徴学習に基づく学習に基づくメッシュの雑音低減方法とは異なり、本発明は三角メッシュ自体の構造を探索し、かつ図に示すように導入し、次に三角形の双対空間にグラフ畳み込み演算を導入する。本発明はこのように幾何学的特徴を自然にキャプチャすることができる図形表示形式を示し、同時にトレーニング段階及び推定段階に対していずれも軽量である。効果的な特徴学習を促進するために、このようなネットワークは静的及び動的エッジの畳み込みを同時に利用し、これにより明示的なメッシュ構造と未接続の隣接との間の潜在的な連絡から情報を学習することができる。未知雑音関数をよりよく推定するために、本発明は複数のGCNのカスケード最適化例を導入し、面の雑音レス法線方向を段階的に推定する。本発明は複数の雑音データセットにおいて最良の結果を実現し、明確な特徴を含むCADモデルと異なる装置からキャプチャされた真の雑音を有する元の走査モデルを含む。本発明の方法は効果と効率との間の良好なバランスを達成すると同時に、現在最も好ましい結果を実現する。
【図面の簡単な説明】
【0015】
図1】本発明のネットワーク雑音除去のプロセス概略図である。
図2】本発明のGCNネットワーク構造である。
図3】は本発明のネットワーク雑音除去効果図である。
【発明を実施するための形態】
【0016】
雑音はメッシュモデル表面の複雑な構成であるため、一般的に局所的な方法を用いてそれを推定する。本発明のターゲットはメッシュ三角形の双対領域において各パッチを、その一定の範囲内の雑音でのブロックを利用し、該パッチの元の雑音レス法線方向を予測し、かつ雑音なしのモデルを再構成し、具体的には以下のステップを含む。
ステップ1:雑音メッシュ内の各面に局所ブロックを生成しかつテンソル投票アルゴリズムを採用して局部ブロックを回転整列する。
ステップ2:ステップ1で整列された局所ブロックを図に示すように変換し、トレーニングされたグラフ畳み込みニューラルネットワークに入力し、雑音のない法線方向を予測し、さらに予測された法線方向に基づいてメッシュモデルの頂点を更新し、雑音除去後のモデルを取得する。ここで、前記畳み込みニューラルネットワーク構造はL層EdgeConv、L層動的EdgeConv及びL層全結合(FC)層で構成される。
【0017】
図1は本発明における複数のグラフ畳み込みニューラルネットワークカスケードの雑音除去フローを説明する。以下、具体的な実施例を参照して本発明の方法をさらに説明する。
【0018】
雑音メッシュに対して、まず入力三角形メッシュをM={V、F}と定義し、ここでV={vは全ての頂点を設定し、F={f Nfは全ての面を設定する。N及びNは、それぞれ頂点数及び面数である。Fにおける各面fに対して、そのローカルブロックデータpを生成する。Mにおける全てのブロックの集合をP={p Nfと定義する。同様に、面fの法線方向をnと表し、その重心をcとして表し、かつその面積をaとして表す。
【0019】
ここで、ブロックpは小平面fの重心c上に位置する半径rの球内の全ての小平面(fを含む)を指し、即ちpは以下を満たすべきである。
【数1】
【0020】
異なる位置にあるが同様の性質を有するブロックはニューラルネットワークに面倒をもたらし、深層学習方法に対して空間変換を学習しにくいためである。この問題を解決するために、本発明はテンソル投票理論を採用して面を一つの公共座標系に明確に整合し、すなわち当該面中の全ての面投票テンソルを定義し、かつ特徴値及び単位特徴ベクトルを取得し、具体的には以下のとおりである。
【0021】
まずpを原点[0、0、0]に変換し、次にそれを単位境界ボックスにスケーリングする。1つの投票テンソルTの面fに対する定義は以下のとおりである。
【数2】
【0022】
ここでμ=(a/a)exp(-||c-c||/σ)、σはパラメータであり、本実施例では1/3に設定され、ここでaはpにおける最大三角形面積であり、かつn′はfの投票法線ベクトルである。n′=2(n・w)w-n、ここでw=normalize{[(c-c)×n]×(c-c)}である。Tは半正則行列であるため、そのスペクトル分解により以下のように表すことができる。
【数3】
【0023】
ここでλ≧λ≧λはその特徴値であり、e、e及びeは対応する単位特徴ベクトルであり、それらは一組の直交基を構成する。
【0024】
次に、1つの回転行列R=[e、e、e]を構築し、かつpにおける各小面の重心及び法線方向をR -1に乗算して新たなブロックデータ
を生成する。
【0025】
その後、各生成されたブロックに図構造を確立してそれを本発明者らの後のパターン畳み込みネットワークに適応させる。無向グラフG=(Q、E、Φ)を確立し、ここでブロック
内の各面fに図面上のノードq∈Q、及び一つの辺e=(q、q)∈Eを作成して対応する面f及びfが隣接する。Φはノード特徴を表し、一組のノード属性を含む。各のφ∈Φ、対応面

及び
は整列後の平面fiの重心及び法線方向を指す。dはfの1環近傍における隣接する面の数であり、境界面を区別することに役立つ。
【0026】
図2に示すように、本発明のGCNネットワークは複数の畳み込み層で構成されることを説明した。(Martin Simonovsky and Nikos Komodakis. 2017. Dynamic edge-conditioned filters in convolutional neural networks on graphs. In 2017 IEEE Conference on Computer Vision and Pattern Recognition (CVPR). 29-38. )各層において、従来の畳み込みネットワークと類似し、本発明のGCNは各ノードの隣接ノードの特徴をまとめて更新し、畳み込み操作とも呼ばれる。各図は面に一定の連通性を有するが、それらの構造はブロックに非常に異なる。したがって本発明者らはECC(Edge-Conditioned Convolution)ポリシーを用いて畳み込みプロセスにおける異なる構造を処理する。G=(Q、E、Φ)はグラフ畳み込みにおける第1層であり、φはGにおける第個のノードの特徴ベクトルである。以下の方式でノード特徴を更新する。
【数4】
【0027】
ここでΨは特徴集合であり、hΘ = LinearΘ (F ,F - F )である。ネットワーク内の各グラフリールのベース層に同様のLinearΘがある。
【0028】
幾何学的図形から連通性のマッピングは一対一の関数ではないため、元の図形構造のみを利用して畳み込みプロセスにおいていくつかの情報が失われる可能性がある。グラフノードの受信領域を豊富にするために、本発明はさらに畳み込みプロセスにおいて隣接しないグラフノードを接続することを可能にする。このようなグラフィックス変換は、動的Edge Convと呼ばれる。この技術案に対して、各ノードの近隣はいずれもノードのユークリッド距離に基づいてKNN(本実施例の実現においてK=8である)により動的に計算される。
本発明のネットワークアーキテクチャはL層の静的Edge Conv、L層の動的Edge Conv及びL層の全結合(FC)層で構成される。グラフ畳み込みの各層の後に、学習された特徴を一緒に接続してプール化を行う。本実施例において、平均プール及び最大プールをいずれも対称関数として使用し、それらは最も重要な特徴を選択することができる。最後に、FC層は3Dベクトルを回帰し、すなわち本発明の予測する法線方向である。最後のFC層以外、本発明のアーキテクチャにおける各層はバッチ処理正規化及び活性化関数LeakyReLUを有する。
【0029】
好ましい解決手段として、カスケード接続されたGCN(GCN、…、GCN)で雑音無しの法線方向を段階的に回帰する。カスケード最適化における全てのGCNは同じアーキテクチャを有するが、異なる静的Edge Conv、動的Edge Conv及びFC層の数を有する。本実施例において、一つ目のGCNに対して、Le=3、Ld=3、かつLl=4を使用し、残りのGCNに対して、Le=2、Ld=2、Ll=3を使用する。
【0030】
毎回の法線方向予測の更新後にいずれも頂点の位置を更新する必要があり、本発明の方法において頂点更新は以下の式に定義することができ、ここで、
には、該頂点の領域はその近傍頂点を含み、該頂点の領域はその隣接頂点の関連付けパッチを含む。
【数5】
【0031】
kは頂点更新の反復回数を示し、上付きgは目標法線方向を示し、前のx-1段のGCN更新において、ネットワーク出力の予測値であり、最終段の更新において、最適化後の法線方向を示す。eijはパッチにおける二つの頂点の間の辺を示す。
【0032】
オフライントレーニングステップにおいて、GCNの出力を用いてトレーニング集合の雑音メッシュに対して雑音除去を行い、次にこれらの更新されたメッシュから新しいデータを生成して次のGCNx+1をトレーニングする。ネットワークの検証セットでの誤差が減少しない場合、カスケードGCNを停止することができる。損失関数はネットワーク出力と基準値との間のMSEであり、すなわちR-1
である。ここで、
は面fの真の雑音メッシュの法線方向であり、Rは上記対応する回転行列である。
【0033】
好ましい解決手段として、各3Dモデルに対して、異なるレベル及びタイプの雑音を生成してトレーニングする。テンソル投票アルゴリズムをデータセット中の無雑音モデルの各面に適用し、三つの特徴値λ1、λ2、λ3を取得する。各モデルに対して各面を四組に分け、{fi|λi 2<0.01Λλi 3<0.001}は平面であり、{fi|λi 2>0.01Λλi 3<0.1}は辺表面であり、{fi|λi 3>0.1}は角表面であり、残りは遷移面である。辺表面及び角表面は他の二種に比べて少なく、さらに二組に分けられ、平面及び遷移面で構成された特徴的な面は、辺表面及び角表面で構成された特徴面である。この二組の中にトレーニングデータとしてブロックを均一に収集する。このポリシーは全てのGCNをトレーニングすることに適用される。
【0034】
好ましい解決手段として、一つの入力雑音メッシュの予測法線方向を与え、局所処理による隣接面の間の不連続性を回避するために、バイラテラルフィルタ(Youyi Zheng、Hongbo Fu、Oscar Kin-Chung Au、and Chiew-Lan Tai.2011.Bilal normal filtering for mutenoising.IEEE Transisons on Visualization and Computer Graphics 17、10(2011)、1521-1530.)を適用してGCN予測の法線方向を微調整することができる。
【数6】
【0035】
この操作反復はm回反復することができるが、最後のカスケードGCNにおける法線出力のみに適用される。ここで
は反復最適化m+1回の法線方向であり、
はm回目の反復により得られた法線方向に基づいて頂点を更新した後のパッチに算出された法線方向である。Ωは隣接fの集合であり、WとWはそれぞれσsとσrコアのガウス関数である。
【0036】
図1及び3はそれぞれ本方法のスレーブ装置がキャプチャした実際の雑音の元の走査モデル及び明瞭な特徴を含むCADモデルの雑音除去結果を示し、最も左が入力された雑音モデルであり、中間が結果であり、最も右が元の雑音レス真値である。図から分かるように、本発明の方法は良好な雑音除去効果を有し、効果と効率との間の良好なバランスを達成することができる。
図1
図2
図3