【解決手段】システムと方法は、抽出された1以上のスパース3次元形状から、オブジェクトの第1領域に対応する方位角値の第1セットを識別することにより、πの曖昧性を解決する。位相角を使用して、方位角値の第1セットと推定される方位角値の第2セットとの間の関係構造をキャプチャしたグラフを構築する。構築されたグラフに対応するグラフフーリエ変換(GFT)行列を取得する。そして、グラフ信号処理技術により、GFT行列と方位角値の第1セットから、オブジェクトの第2領域に対応する方位角値の第2セットを推定する。
方位角値の第2セットを推定するステップの前に、グラフ信号処理技術の実行によって方位角値の第1セットに対応するサンプリングセットを取得する、請求項1に記載の方法。
グラフを構築するステップが、方位角値の第2セットを推定するための位相角のグラフフーリエ変換(GFT)スペクトルをグラフ信号処理技術によって表すことを含む、請求項1に記載の方法。
GFTスペクトルを表すステップが、GFTスペクトルに基づいて、カットオフグラフ周波数を選択して方位角値の第2セットを推定することを含み、カットオフグラフ周波数は構築されたグラフに対応する、請求項4に記載の方法。
位相角と、識別された方位角値の第1セットおよび推定された方位角値の第2セットの組み合わせとが、構築されたグラフ上でキャプチャされた同一の帯域制限を有し、同一の帯域制限は、方位角値の第1セットおよび方位角値の第2セットの組み合わせの各々の間の最適な表現を表す、請求項1に記載の方法。
1以上のハードウェアプロセッサ(104)が、方位角値の第2セットを推定するステップの前に、グラフ信号処理技術の実行によって方位角値の第1セットに対応するサンプリングセットを取得するように構成される、請求項7に記載のシステム(100)。
1以上のハードウェアプロセッサ(104)が、グラフ信号再構築技術を使用してGFT行列に線形変換を実施して、方位角値の第2セットを推定するように構成される、請求項7に記載のシステム(100)。
1以上のハードウェアプロセッサ(104)が、グラフ信号処理技術を使用して、方位角値の第2セットを推定するための位相角のグラフフーリエ変換(GFT)スペクトルを表すことによって、グラフを構築するように構成される、請求項7に記載のシステム(100)。
1以上のハードウェアプロセッサ(104)が、GFTスペクトルに基づいて、カットオフグラフ周波数を選択して方位角値の第2セットを推定することによって、GFTスペクトルを表すように構成され、カットオフグラフ周波数は構築されたグラフに対応する、請求項10に記載のシステム(100)。
位相角と、識別された方位角値の第1セットおよび推定された方位角値の第2セットの組み合わせとが、構築されたグラフ上でキャプチャされた同一の帯域制限を有し、同一の帯域制限は、方位角値の第1セットおよび方位角値の第2セットの組み合わせの各々の間の最適な表現を表す、請求項7に記載のシステム(100)。
方位角値の第2セットを推定するステップの前に、グラフ信号処理技術の実行によって方位角値の第1セットに対応するサンプリングセットを取得する、請求項13に記載の1以上の非一時的な機械可読情報記憶媒体。
方位角値の第2セットを推定するステップが、グラフ信号再構築技術を使用してGFT行列に線形変換を実施することを含む、請求項13に記載の1以上の非一時的な機械可読情報記憶媒体。
【発明を実施するための形態】
【0018】
例示的な実施態様は、添付の図面を参照して説明される。図では、参照番号の左端の数字は、参照番号が最初に現れる図を識別する。便宜上、図面全体を通して同じ参照番号を使用して、同じまたは同様の部品を指す。開示された原理の例および特徴が本明細書で説明されているが、開示された実施態様の精神および範囲から逸脱することなく、修正、適合、および他の実行が可能である。以下の詳細な説明は例示としてのみ考慮されることを意図しており、真の範囲および精神は添付の特許請求の範囲によって示される。
【0019】
本開示の実施態様は、グラフ信号処理を使用してオブジェクトの高密度な表面の再構築のためのシステムおよび方法を提供する。マルチビューステレオ(MVS)3次元(3D)表面再構築は、3Dスキャンと印刷、製品検査などの拡張現実を含むアプリケーションのコンピュータビジョンにおける重要な問題である。これらのアプリケーションの多くでは、高密度な再構築を取得することが最も望ましい。しかしながら、実際には、MVSのさまざまな制限(たとえば、特徴の対応に基づいている)により、オブジェクトの高密度な表面の再構築を提供できない。
【0020】
偏光マルチビューステレオ(PMS)として知られる代替アプローチは、偏光からの測光情報と複数のビューからのエピポーラ拘束を組み合わせることにより、特徴がスパースなオブジェクトの高密度3D表面を再構築する(参照: Z. Cui, J. Gu, B. Shi, P. Tan, and J. Kautz, “Polarimetric multi-view stereo,” in Proceedings of the IEEE Conference on Computer Vision and Pattern Recognition, 2017, pp. 1558-1567)。PMSは、偏光拡散のみまたは偏光正反射のみの実用的ではない仮定を使用せず、照明方向または赤緑青および深度(RGB−D)センサーなどの追加センサーの必要性も克服する。
【0021】
偏光されていない光が表面に入射すると、ほとんどの表面は部分的に偏光された光を反射する。この偏光された光は、黄褐色のオブジェクトの表面法線に関する豊富な情報を含み、偏光からの形状(SfP)キューの基礎を形成する。このようにPMSを使用して取得される表面法線は高密度であり、上記の他の技術とは異なり、制御された照明や高密度な特徴を必要としないため、滑らかな特徴のない3Dオブジェクトを高密度に再構築できる。
【0022】
しかしながら、偏光から取得された表面法線には特定の曖昧性があり、形状の再構築に有意義に使用する前に解決する必要がある。SfPアプローチを使用する際の主な曖昧性の1つは、位相角からの方位角の推定にある。方位角推定では、π/2の曖昧性とπの曖昧性と呼ばれる2種類の曖昧性を解決する必要がある。
【0023】
従来のシステムおよび方法のいくつかは、π/2の曖昧性の解決を提供するが、従来のシステムおよび方法のいずれも、πの曖昧性の解決を提供しない。PMSなどの従来のシステムと方法は、単純にπの曖昧性をバイパスする一方で、高密度な再構築を提供するため、πの曖昧性を解決しない。
【0024】
ここで図面、特に
図1〜7Cを参照すると、類似の参照文字は図面全体を通して一貫して対応する特徴を示し、好ましい実施態様が示され、これらの実施態様は、以下の例示的なシステムおよび/または方法の文脈で説明される。
【0025】
図1は、本開示の一実施態様による、グラフ信号処理を使用したオブジェクトの高密度な表面の再構築のためのシステム100の例示的なブロック図を示している。一実施態様では、システム100は、1以上のプロセッサ104、通信インターフェースデバイスまたは入力/出力(I/O)インターフェース106、および1以上のプロセッサ104に動作可能に結合された1以上のデータ記憶デバイスまたはメモリ102を含む。ハードウェアプロセッサである1以上のプロセッサ104は、1以上のマイクロプロセッサ、マイクロコンピュータ、マイクロコントローラ、デジタル信号プロセッサ、中央処理ユニット、ステートマシン、論理回路、および/または操作命令に基づいて信号を操縦(manipulate)するデバイスとして実行できる。他の機能の中でも、プロセッサは、メモリ102に格納されたコンピュータ可読命令をフェッチして執行するように構成されている。一実施態様では、システム100は、ラップトップコンピュータ、ノートブック、ハンドヘルドデバイス、ワークステーション、メインフレームコンピュータ、サーバ、ネットワーククラウドなどの様々なコンピューティングシステムで実行することができる。
【0026】
I/Oインターフェースデバイス106は、さまざまなソフトウェア、および、例えばウェブインターフェース、グラフィカルユーザーインターフェースなどのハードウェアインターフェースを含むことができ、LAN、ケーブルなどの有線ネットワーク、およびWLAN、セルラー、衛星などのワイヤレスネットワークを含む、多種多様なネットワークN/Wおよびプロトコルタイプ内での複数の通信を容易にすることができる。一実施態様では、I/Oインターフェースデバイスは、多数のデバイスを互いにまたは別のサーバに接続するための1以上のポートを含むことができる。
【0027】
メモリ102は、例えば、スタティックランダムアクセスメモリ(SRAM)およびダイナミックランダムアクセスメモリ(DRAM)などの揮発性メモリ、および/または、読み取り専用メモリ(ROM)、消去可能なプログラマブルROM、フラッシュメモリ、ハードディスク、光ディスク、および磁気テープなどの不揮発性メモリを含む、当技術分野で知られている任意のコンピュータ可読媒体を含み得る。
【0028】
図1を参照して、
図2A〜
図2Cは、本開示のいくつかの実施態様による、グラフ信号処理を使用するオブジェクトの高密度な表面の再構築のための方法の例示的なフロー図を示す。一実施態様では、システム100は、1以上のハードウェアプロセッサ104に動作可能に結合されたメモリ102の1以上のデータストレージデバイスを備え、1以上のプロセッサ104による方法のステップの執行のための命令を格納するように構成される。ここで、本開示の方法のステップを、
図1に示されるシステム100のコンポーネントおよびフロー図を参照して説明する。本開示の実施態様では、ハードウェアプロセッサ104は、命令が構成されると、本明細書で説明される1以上の方法を実施する。
【0029】
本開示の一実施態様によれば、ステップ201で、画像キャプチャデバイス(図示せず)を介して複数のマルチビュー偏光画像をキャプチャすることができ、複数のマルチビュー偏光画像の各々は、複数の偏光角で変わるオブジェクトのマルチピクセル画像を含む。画像キャプチャデバイスは、偏光レンズを備えたデジタル一眼レフカメラ(DSLR)カメラを含むことができるが、これに限定されない。DSLRカメラの偏光レンズを異なる偏光角で回転させて、各角度から(関心のある)オブジェクトの少なくとも1つのマルチピクセル画像をキャプチャし、複数のマルチビュー偏光画像を取得する。
【0030】
当技術分野で知られているように、偏光されていない光が任意のオブジェクトに当たると、3つのタイプの反射、すなわち偏光正反射、偏光拡散反射、および偏光されていない拡散反射が観察され、偏光正反射および偏光拡散反射の両方は、ほとんどの表面で部分的に偏光される。次に、反射光は偏光レンズを通過し、前述のように、偏光レンズは異なる偏光角(つまり、少なくとも3つの異なる偏光角)で回転し、複数のマルチビュー偏光画像を取得する。
図3A〜
図3Cを参照すると、0°(度)、60°、および120°でキャプチャされた複数のマルチビュー偏光画像の例を参照することができる。
【0031】
本開示の一実施態様によれば、ステップ202で、1以上のハードウェアプロセッサ104は、キャプチャされた複数の偏光画像に基づいて複数のステップを実施する。ステップ202(i)で、1以上のハードウェアプロセッサ104は、キャプチャされた複数のマルチビュー偏光画像の各々にマルチビューステレオ(MVS)技術を実行することにより、オブジェクトの1以上のスパース3次元形状を抽出する。一実施態様では、1以上のスパース3次元形状を使用して、オブジェクトの第1領域に対応する方位角値の第1セットを識別する(以下のステップ203(i)で説明する)。
【0032】
当該技術分野で知られているように、MVS技術(またはマルチビュー3次元(3D)表面再構築技術)は、異なる視点から撮影された画像のセットから完全な3次元(3D)モデルを再構築することを含む。MVS技術は、2つの主要なステップで構成される:(i)局所(local)画像マッチング法を使用して、写真一貫性測定と可視性モデルに基づいて3Dポイントを推定するステップ、(ii)推定された3Dポイントクラウドから3Dモデルを再構築するステップ。
【0033】
一実施態様では、オブジェクトの1以上のスパース3次元形状を抽出するために実行され得るMVS技術は、レベルセット技術またはスペースカービング技術を含み得る。MVS技術の実行によって抽出された複数の偏光画像の各々のスパース表現(または1以上のスパース3次元形状)は、復元データを含み、それによって強化されたマルチビュー偏光画像を提供する。実行例において、
図4を参照すると、キャプチャされた複数のマルチビュー偏光画像の各々にMVS技術を実行することにより抽出されたスパース3次元形状の例が参照され得る(
図3A〜3Cで参照すると)。
【0034】
ステップ202(ii)で、1以上のハードウェアプロセッサ104は、キャプチャされた複数のマルチビュー偏光画像に偏光反射率モデリング技術(例えば、ランバートモデリング)を実行することにより、オブジェクトの表面点の各ビューに対応する偏光度および位相角を計算する。当技術分野で知られているように、とりわけ、反射光の偏光成分の大きさ、1以上の正反射によって引き起こされる強度エッジ、表面法線の拘束などを正確に予測するために、偏光反射率モデリング技術が使用される。
【0035】
前述のように、偏光されていない光がオブジェクトに当たると、偏光正反射、偏光拡散反射、および偏光されていない拡散反射の3つのタイプの反射が観察される場合があり、偏光正反射と偏光拡散反射の両方が、ほとんどの表面で部分的に偏光されている。かかる反射偏光成分の強度は、偏光関数、例えばΦ
polの偏光角の関数として正弦波的に変わる。特に、偏光拡散反射I
dp(Φ
pol)および偏光正反射I
sp(Φ
pol)に対応する測定強度は、以下の式(1)で表される
【数1】
ここで、
【数2】
およびI
maxとI
minは、観測された正弦波状に変わる強度の最大値と最小値をそれぞれ示す。オブジェクトの表面の任意の点での位相角Φ(phi)と方位角φは、優勢的な反射タイプに依存し、以下の式(2)に示すように関連している。
【数3】
係数
【数4】
は非偏光強度を示し、
係数
【数5】
は偏光度と呼ばれる。
反射のタイプ、つまり偏光拡散反射または偏光正反射に応じて、偏光度ρは以下の式(3)および(4)のように関連する場合がある。
【数6】
【数7】
ここで、nとθはそれぞれ屈折率と天頂角を示す。一実施態様では、式(3)は、偏光正反射の関係を提供する一方で、式(4)は偏光拡散反射の関係を提供する。一般に、位相角Φ(phi)は、原点またはゼロ交差に関して経過した振動の一部を示す。偏光度は、オブジェクトに対応する入射光の偏光度を含む。一実施態様では、計算された位相角Φ(phi)は、特徴が制限された領域での方位角値の推定を容易にする。
【0036】
上記のステップ201と同じシナリオ例を考えて、偏光反射モデリング技術、たとえば非線形最小二乗アルゴリズムを使用して、位相角Φと偏光度ρを0°(度)、60°および120°で次のようにキャプチャされた複数のマルチビュー偏光画像に対して計算することができる。
Φ=0.9777、0.0896、0.5204、0.3205、および0.8261;
ここで、計算された位相角値は、オブジェクトの表面上の5つの隣接点のセットに対応し、各計算された位相値は、5つの隣接点のセットのうちの1つの点に対応する。
【0037】
本開示の一実施態様によれば、ステップ203において、1以上のハードウェアプロセッサ104は、計算された位相角および1以上のスパース3次元形状を使用して、方位角値の第2セットを推定し、方位角値の第2セットは、グラフ信号処理技術を実行することにより推定される。推定された方位角値の第2セット(明確な方位角値を含む)は、πとπ/2の両方の曖昧性を解決する。したがって、単にπ/2の曖昧性を解決する従来のシステムおよび方法と比較して、提案された開示は、グラフ信号処理技術を実行することにより、πおよびπ/2の両方の曖昧性を解決する方法論を提供する。方位角値の第2セットを推定してπの曖昧性を解決するプロセスを詳細に検討することができる。
【0038】
グラフ信号処理−
グラフ信号、グラフフーリエ変換(GFT)、帯域制限、サンプリングおよびサンプリングされた信号の再構築を理解することにより、方位角値の第2セットを推定するためのグラフ信号処理(グラフ信号処理技術とも呼ばれる)の実行について説明する。
【0039】
一実施態様では、グラフ信号は、サンプルがグラフGのノードによってインデックス付けされる信号である。
【数8】
は、V={1,2,…,N}のセットでインデックス付けされたN個のノードで構成される、既知の接続された無向の加重グラフを示し、エッジ
【数9】
によって接続され、ここで、w
pqはp
thとq
thとのノード間のエッジの重みを示し、w
pp=0である。[W]
p、q=w
pqのN×N隣接行列Wは対称行列、つまり、無向グラフの仮定による
【数10】
である。グラフラプラシアンはキー行列を含み、L=D−Wとして定義でき、ここで、対角行列D=diag{d
1,d
2,…,d
N}は次数行列と呼ばれ、すべてにおいて、
【数11】
【0040】
グラフ信号処理技術のグラフシフト演算子Sは、シフト演算子、つまり、従来の離散信号処理技術におけるシフトz
−1によって実施されるのと同様の関数を実施する。一般に、Sの選択は、ラプラシアン行列または隣接行列のいずれかを含む。Sは対称行列であるため、分解S=[u
1,……,u
N]diag(λ
1,……,λ
N)[u
1,……,u
N]
Hを受け入れる。固有ベクトルU={u
1,……,u
N}および対応する固有値{λ
1,……,λ
N}は、グラフのコンテキストで頻度の概念を提供し、したがって、行列U
HおよびUは、それぞれ順グラフフーリエ変換(GFT)行列および逆GFT行列と呼ばれる場合がある(参照:D. I. Shuman, S. K. Narang, P. Frossard, A. Ortega, and P. Vandergheynst, “The emerging field of signal processing on graphs: Extending high-dimensional data analysis to networks and other irregular domains,” IEEE Signal Processing Magazine, vol. 30, no. 3, pp. 83-98, 2013)。したがって、グラフ信号fのGFTおよび逆GFTは、それぞれ
【数12】
として定義できる。
【0041】
さらに、グラフ信号fは、|λp|>ωですべてのpに対して
【数13】
の場合、
ω帯域制限として定義できる。
一実施形態では、R={1,2,……,r)および相補セットを
【数14】
とし、rはωより小さい固有値の数を示し、U
VRはRに対応する列を含むUのサブ行列を示す。したがって、ω帯域制限信号は、以下の式(5)で表すことができる:
【数15】
セット{u
1,u
2……,u
r}は、PW
ω(G)で示されるペイリー・ウィーナー空間と呼ばれるベクトル空間に広がり、すべてのω帯域制限グラフ信号を含む。
【0042】
一実施態様では、帯域制限により、情報の損失なしに信号fをサンプリングし再構築することができる。Sがサンプリングセットを示すもの、つまり、Sは、|S|=dのサンプリングノードのインデックスを含むとする。
S
dを、その列がSの指標関数であり、サンプリングセット演算子
【数16】
である、サイズN×dの行列とする(Reference: A. Anis, A. Gadde, and A. Ortega, “Efficient sampling set selection for bandlimited graph signals using graph spectral proxies,” IEEE Transactions on Signal Processing, vol. 64, no. 14, pp. 3775-3789, 2016)。サンプリングされたベクトルは
【数17】
同様に、サンプリングされた信号f
Sからの再構築は、以下の式(6)を使用して実施でき、
【数18】
ここで、サブ行列は、
【数19】
である。
行列U
VRおよびU
SRの次元を参照すると、
【数20】
が再構成の基本要件であることが簡単に分かる。
【0043】
上記のグラフ信号処理技術から、方位角値の第2セットの推定を詳細に検討することができる。計算された位相角と1以上のスパース3次元形状を使用して方位角値の第2セットが推定されることを思い出して、一実施態様では、1以上のハードウェアプロセッサ104は、ステップ203(i)で、1以上のスパース3次元形状から、オブジェクトの第1領域に対応する方位角値の第1セットを識別する。
【0044】
一実施態様では、第1領域は、オブジェクトの特徴が豊富な領域を含む。当技術分野で知られているように、MVS技術などの従来の技術は特徴の対応に基づいており、したがって、1以上のスパース3次元形状から、方位角値の第1セットを直接的に識別することができる。1以上のスパース3次元形状(
図4を参照)から、方位角値(ラジアン単位)の第1セットは、0.7706および1.7507として識別され得る。
【0045】
本開示の一実施態様によれば、ステップ203(ii)において、1以上のハードウェアプロセッサ104は、計算された位相角を使用して、方位角値の第1セットと推定される方位角値の第2セットとの間の関係構造を含むグラフを構築する。提案された開示は、2つの観測を考慮した後のグラフの構築を容易にし、すなわち、偏光拡散反射または偏光正反射のみで、位相角場と方位角場の絶対変化は同義、つまり小さな近傍領域における各位相角値と方位角値との間の絶対角距離は類似しており;また、オブジェクトの反射タイプが変化すると、位相角場がπ/2だけ急激に変化する。
【0046】
計算された位相角と上記の2つの観測に基づいて、提案された開示はグラフの構築を容易にし、構築されたグラフは、方位角値の第2セットの各々の間の関係構造を効果的にキャプチャする。グラフを構築するプロセスを詳細に検討することができる。N
x×N
yをキャプチャされた偏光画像サイズとし、N=N
xN
yを画像内のピクセル数とする。一実施態様では、セットV={1,2,…,N}によってインデックス付けされたNノードグラフが最初に構築され得る。ここで、任意の
【数21】
について、Φ
pはノードpでの位相角を示し、さらに任意の2つのノード
【数22】
の間で、エッジの重みw
pqは、以下の式(7)で計算され得る:
【数23】
ここで、関数は
【数24】
であり、
およびdist(p,q)は、ピクセルpとqの位置間のユークリッド距離を示す。g(Φ
p,Φ
q)は、2つの角度Φ
pとΦ
qの間の距離を計算し、反射タイプの変化による位相角π/2の変化に対して不変であることが容易にわかる。
【0047】
再び式(7)を参照すると、式(7)の係数ε
gおよびε
dが近傍領域を決定する。
図5を参照して、例示的なシナリオを考慮すると、構築されたグラフの例を参照することができ、ノードはオブジェクトの第1領域を表す。
【0048】
本開示の一実施態様によれば、ステップ203(iii)で、1以上のハードウェアプロセッサ104は、構築されたグラフに対応するGFT行列を取得する。一実施態様では、再び式(7)を参照して、エッジ重みε
gおよびε
dを使用して、グラフラプラシアンL、GFT行列Uなどのグラフの残りの属性を取得することができる。グラフ信号再構築技術を実行することにより、グラフラプラシアンL、GFT行列U、およびその他の残りの属性を取得(または推定)することができる。例示的な実行では、
図5において構築されたグラフを再び参照して、上記のグラフ信号処理技術を実行することにより、以下の表1に示されるように対応するGFT行列を取得することができる。
【表1】
【0049】
一実施態様では、1以上のハードウェアプロセッサ(104)は、方位角値の第2セットを推定するグラフ信号再構築技術を実行することにより、GFT行列に線形変換を実施する。「Systems and methods for sampling and reconstruction of band-limited graph signals by a graph parity check matrix technique」というタイトルの、共同所有の同時係属中のインド出願「201821009840」に記載されているように、グラフ信号再構築技術は、グラフパリティチェック行列によってサンプリングされた信号の再構築を提供する。線形変換行列は、以下の表2に示すように、グラフ信号再構築技術を実行することで取得できる。
【表2】
【0050】
本開示の一実施態様によれば、ステップ203(iv)で、1以上のハードウェアプロセッサ104は、GFT行列および方位角値の第1セットから、グラフ信号処理技術を実行することにより、オブジェクト表面の第2領域に対応する明確な方位角値を含む、方位角値の第2のセットを推定する。一実施態様では、第2領域は、方位角値の第2セットが推定されるオブジェクトの特徴が制限された領域を含む。
図5の構築されたグラフを再び参照すると、ノード3、4、および5は第2領域を表す。
【0051】
上述のように、従来のシステムおよび方法は、π/2の曖昧性のみを解決するものであり、従来のシステムおよび方法はいずれも、πの曖昧性を解決するものではない。次に、方位角値の第2セットを推定するプロセスを詳細に検討することができる。
【0052】
一実施態様において、
【数25】
は、それぞれΦ=[Φ
1,Φ
2,…,Φ
N]
Tおよびφ=[φ
1,φ
2,…,φ
N]
Tとして表現され得る位相角および方位角のベクトルを示すとし、ここで、Φ
pと同様に、すべての
【数26】
に対して、φ
pは、ノードpの方位角を示す。Φ、構築されたグラフ、および方位値の最初のセットを取得すると、問題(提案された開示によって解決される)は、方位値の第2第1を推定することである。
【0053】
本開示の実施態様によれば、ΦおよびφのGFTは、
【数27】
として計算され得る。ΦはΦの曖昧な推定に過ぎないことを想起し、式(7)を使用して構築されたグラフエッジでは、
【数28】
および
【数29】
の両方が同じ滑らかさを持っていること、つまり、両方とも同じカットオフグラフの周波数ω、または文字
【数30】
を持っていることがわかる。V
+は、信頼できる深度情報が得られるオブジェクトの領域の第1セット(つまり、特徴が豊富な領域)に対応する頂点のセットを表し、それにより、方位角値の第1セットが使用可能になる。
【0054】
グラフ信号Φ
V++C
Φ、φ
V++C
φは、グラフインデックス(または頂点のセット)V
+にそれぞれ対応する位相角および方位角を示す。頂点のセットV
+に対応する位相角は明確なので、Φ
V+=φ
V+である。セットV
+およびグラフ信号φ
V+は、サンプリングセットSおよびサンプリングされたグラフ信号f
S(上記のグラフ信号処理技術で説明)に類似していることに注意されたく、このアナロジーから、サンプリングされた方位角φ
V+および式(2)を使用して、次の式(8)に示すように、方位角信号(または方位角値の第2セット)を推定でき:
【数31】
ここで、U
V+RはU
SRと同様であり、セットRは、上記のように
【数32】
であるため、GFTスペクトル
【数33】
を観察することによって見つけることができる。
さらに、カットオフグラフ周波数ωは、GFTスペクトルが正確に0に到達しないため、GFTスペクトル
【数34】
に閾値を設定することで決定できる。推定されたφは、πとπ/2の両方の曖昧性を解決する。さらに、上記のグラフ信号処理技術で説明したように、|V
+|>|R|は、φを推定するための基本的な要件で構成される。したがって、グラフを構築するステップは、方位角値の第2セットを推定するための位相角のグラフフーリエ変換(GFT)スペクトルをグラフ信号処理技術によって表すことを含む。
実行例では、上記の表1のGFT行列および識別された値の第1セットから、方位角値の第2セット(ラジアン単位)は、1.9068、-2.0293および2.7394と推定され得る。さらに再び
図5を参照すると、GFTスペクトル(ノード1およびノード2を含む)の例を参照することができる。
【0055】
本開示の一実施態様によれば、ステップ204で、1以上のハードウェアプロセッサ104は、推定された方位角値の第2セットと計算された位相角との比較に基づいて、オブジェクトの偏光正反射優勢領域および偏光拡散反射優勢領域を分類する。一実施態様では、識別された方位角値の第1セットと推定された方位角値の第2セットとの組み合わせに基づいて比較を実施することができる。したがって、識別された方位角値の第1セットと推定された方位角値の第2セット(ラジアン)の組み合わせは以下を含むことができる:
0.7706、1.7507、1.9068、-2.2093、および2.7394;
【0056】
一実施態様では、比較は、例えば、方位角値の第1セットおよび方位角値の第2セットから計算された位相角を減算することにより実施され得る。実行例では、上記のステップ202(ii)で計算された位相角、すなわち、Φ=0.9777、0.0896、0.5204、0.3205、および0.8261を考慮すると、オブジェクトの偏光正反射優勢領域および偏光拡散反射優勢領域を分類するための比較に基づいて以下の値のセットを取得でき得る:
-0.2071、1.6611、1.3864、-3.9205、および1.9132;
ここで、第1の値、つまり-0.2071は0.7706から0.09777を引くことによって取得され、第2の値1.6611は1.7507から0.0896を引くことなどによって取得される。
【0057】
上記の値のセットを参照すると、第2の値、第3の値、および第5の値がπ/2(つまり、1.57)に近いため、第2のノード、第3のノード、および第5のノード(5つのエッジのセットを含むグラフで検討した場合)はπ/2に近いため、第2のノード、第3のノード、第5のノードは偏光正反射優勢領域として分類される一方で、第1のノードおよび第4のノードは偏光拡散反射優勢領域として分類され得る。最後に、第4のノードは、πの曖昧性が解決されることを示している。
【0058】
本開示の一実施態様によれば、ステップ205で、1以上のハードウェアプロセッサ104は、非線形最小二乗推定法を実行することで、オブジェクトの偏光正反射優勢領域および偏光拡散反射優勢領域の分類に基づいて、天頂角を推定し、天頂角は、偏光度とオブジェクト表面の屈折率との関数である。天頂角θは、式(3)または式(4)を使用して推定できる。
【0059】
当技術分野で知られているように、非線形最小二乗法は、m個の観察を非線形な未知のn個(m>n)のパラメーターのモデルにフィットさせる最小二乗分析の形式で使用する。これは非線形回帰のある種の形式として使用される。この手法の基礎はモデルを線形のもので近似し、逐次的繰り返しによって洗練していくことである。
【0060】
一般に、当技術分野で知られているように、天頂角(方位角および偏光度とともに)は、ピクセルの1以上の勾配の取得を容易にし、ピクセルの1以上の勾配は、プライマリおよびセカンダリ軸上のマルチビュー偏光画像のセットの深度の変化であり、プライマリおよびセカンダリ軸は、画像キャプチャデバイスを使用してキャプチャされた(マルチビュー偏光画像セットの中から)マルチビュー偏光画像に対応する水平および垂直軸を示す。一実施態様では、推定された天頂角は、オブジェクトの3次元表面(すなわち、高密度な3D表面)の再構築を促進する(以下のステップ206に示され議論される)。実行例では、天頂角はθ=35度(つまり、ラジアンで0.610)と推定される。
【0061】
本開示の一実施態様によれば、ステップ206で、方位角値の第2セットおよび天頂角を使用して、オブジェクトの高密度な3次元表面を再構築することができる。方位角値の第2セットおよび推定された天頂角を統合することにより、つまり(Φ、φ)を使用して、高密度の3次元表面の再構築は、既知の従来のシステムおよび方法のいずれかを使用して、たとえばIsocontour深度トレース技術によって実施できる。
【0062】
本開示の一実施態様によれば、提案された方法論の実行例(すなわち、グラフ信号処理技術による方位角値の第2セットの推定)、および従来のシステムおよび方法との比較がシミュレーション結果のセットを介して詳細に考慮され得る。提案された方法論は、ひとつのオブジェクト、つまり人工的なオブジェクトに対して執行された。 最初に、伝統的なシステムと技術を使用して天頂角と方位角の両方が推定(または計算)され、5つの異なる偏光角、つまり{0、30、60、90、120}に対応する5つの偏光画像が取得される。さらに、位相角Φは、式(1)を解くことにより、すべてのポイントで(つまり、5つの隣接ポイントのセット各々に)計算された。
【0063】
計算された位相角Φを使用して、ε
g=π/6およびε
d=10を想定することにより、上記のグラフ信号処理技術によってグラフを構築できる。さらに、構築されたグラフに対応するGFT行列は、グラフ信号処理技術を実行することにより取得され得る。
図6Aを参照すると、グラフ周波数λに関する実際の方位角(すなわち、グランドトゥルース方位角)のグラフフーリエスペクトルのゲイン線図を参照することができる。さらに
図6Bを参照すると、グラフ周波数λに関する計算された位相角のグラフフーリエスペクトルのゲイン線図を参照することができる。
【0064】
再び
図6を参照すると、位相角と識別された方位角値の第1セットおよび推定された方位角値の第2セットの組み合わせとは、構築されたグラフでキャプチャされた同一の帯域制限を持ち、同一の帯域制限は、組み合わされた方位角値の第1セットと方位角値の第2セットの各々の間の最適な表現(つまり、適切にキャプチャされた関係構造)を表す。
【0065】
したがって、Φを使用し、GFTスペクトルから、1以上のハードウェアプロセッサ104は、カットオフグラフ周波数を選択して方位角値の第2セットを推定し、カットオフグラフ周波数は構築されたグラフに対応する。再び
図6を参照すると、50のグラフ周波数の後、大きさは無視できるようになるため、カットオフグラフ周波数はω=50、および対応する|R|=70として選択される。
【0066】
さらに、サンプリングセット|V
+|(上記のグラフ信号処理技術で説明したように)は、100(約13%)として選択でき、サンプリングセット|V
+|のグラフインデックスは、ランダムに選択できる。これらの位置では、実際の方位角が既知であると想定され(上記のように)、式(8)を使用することにより、人工的なオブジェクトの特徴が制限された領域の方位角値の第2セットが推定される。
【0067】
本開示の一実施態様によれば、提案された方法論と従来のシステムおよび方法との比較を詳細に検討することができ、比較により偏光正反射優勢領域および偏光拡散優勢領域の分類が容易になる。シミュレーションおよび分類のために、
図7Aに示すように、偏光正反射優勢領域と偏光拡散優勢領域の両方が、チェッカーパターンで1以上のハードウェアプロセッサ104によって最初に生成された。再び
図7Aを参照すると、白に対応する領域は偏光正反射優勢を示し、黒に対応する領域は偏光拡散優勢を示す。
【0068】
1以上のハードウェアプロセッサ104は、複数の明確な位置について70個のサンプル(すなわち、サンプルの約9%)をさらに選択する。
図7B〜7Cを参照すると、提案された方法論を実行することにより、および従来のシステムおよび方法(例えば、PMS技術)を実行することにより取得された結果の分類が参照され得る。再び
図7B〜7Cを参照すると、サンプルの数が等しい場合、提案された方法論は、従来のシステムおよび方法と比較して、より良い分類を実施することに留意されたい。
【0069】
提案された開示の実施態様によれば、高密度な3次元表面再構築のための提案されたグラフ信号処理技術の利点がここで考慮され得る。ステップ201〜206で説明したように、提案された方法論では、πとπ/2の曖昧性を別々に解決できる。また、
図7A〜7Cを再び参照すると、提案された方法論は、従来のシステムおよび方法のいくつか、例えばラベル伝播アプローチと比較して、π/2の曖昧性の解決において著しい改善を示す。
【0070】
特徴が制限された領域に対応する方位角値の推定時に(つまり、オブジェクトの第2領域の値の第2セットを推定することにより)、従来のシステムおよび方法のいずれかを実行して、スパースオブジェクトの高密度な深度を再構築できる。最後に、上記のシミュレーション結果を介して示されるように、提案された方法論は、特徴が制限された領域で方位角値を推定するために、オブジェクトの特徴が豊富な領域からの非常に少数のサンプルを必要とする(従来のシステムおよび方法と比較して)。
【0071】
一実施態様では、メモリ102は、グラフ信号処理技術を使用してオブジェクトの高密度な表面の再構築に関連する任意のデータを格納するように構成することができる。一実施態様では、複数のマルチビュー偏光画像、1以上のスパース3次元形状、偏光度および位相角、方位角値の第1セット、構築されたグラフ、および方位角値の第2セットなどは、メモリ102に格納される。さらに、グラフ信号処理技術を使用したオブジェクトの高密度な表面の再構築に関するすべての情報(入力、出力など)は、参照目的で履歴データとしてデータベースに保存することもできる。
【0072】
書面による説明は、当業者が実施態様を作成および使用できるようにするために、本明細書の主題を説明する。主題の実施態様の範囲は、特許請求の範囲によって定義され、当業者が思い付く他の修正を含むことができる。かかる他の修正は、クレームのリテラル言語と異ならない類似の要素を持っている場合、またはクレームのリテラル言語と実質的な違いのない同等の要素を含む場合、クレームの範囲内にあることを意図している。
【0073】
本明細書の本開示の実施態様は、グラフ信号処理技術を実行することによりπの曖昧性を解決する未解決の問題に対処する。したがって、実施態様は、πの曖昧性を解決することにより、高密度な表面の再構築を提供する。さらに、本明細書の実施態様は、推定された方位角値の第2セットと位相角との比較に基づいて、偏光正反射優勢領域および偏光拡散反射優勢領域の分類をさらに提供する。
【0074】
保護範囲は、そのようなプログラムに拡張され、その中にメッセージを含むコンピュータ可読手段に加えられることを理解されたい。そのようなコンピュータ可読記憶手段は、プログラムがサーバまたはモバイルデバイスまたは任意の適切なプログラム可能なデバイスで実行されるときに、方法の1以上のステップを実施するためのプログラムコード手段を含む。ハードウェアデバイスは、例えば、サーバまたはパーソナルコンピュータなどのようなあらゆる種類のコンピュータ、またはそれらの任意の組み合わせを含む、プログラム可能なあらゆる種類のデバイスであり得る。ハードウェアデバイスは、例えば、サーバまたはパーソナルコンピュータなどのようなあらゆる種類のコンピュータ、またはそれらの任意の組み合わせを含む、プログラム可能なあらゆる種類のデバイスであり得る。デバイスは、例えば、ハードウェア手段、例えば、特定用途向け集積回路(ASIC)、フィールドプログラマブルゲートアレイ(FPGA)、もしくは、たとえば、ASICおよびFPGA、または少なくとも1つのマイクロプロセッサと少なくとも1つのメモリとソフトウェアモジュールが配置されているハードウェア手段とソフトウェア手段の組み合わせであり得る手段も含み得る。したがって、手段はハードウェア手段とソフトウェア手段の両方を含むことができる。本明細書で説明される方法の実施態様は、ハードウェアおよびソフトウェアで実行され得る。デバイスにはソフトウェア手段も含まれる場合がある。あるいは、実施形態は、異なるハードウェアデバイス、例えば、複数のCPUを使用して実行され得る。
【0075】
本明細書の実施態様は、ハードウェア要素およびソフトウェア要素を含むことができる。ソフトウェアに実行される実施態様は、ファームウェア、常駐ソフトウェア、マイクロコードなどを含むが、これらに限定されない。本明細書で説明される様々なモジュールによって実施される関数は、他のモジュールまたは他のモジュールの組み合わせによって実施されてもよい。この説明の目的のために、コンピュータ使用可能またはコンピュータ読み取り可能な媒体は、命令執行システム、装置、またはデバイスによって、またはそれらに関連して使用するプログラムを含む、格納する、通信する、伝播する、または転送することができる任意の装置であり得る。
【0076】
図示されたステップは、示された例示的な実施態様を説明するために提示されており、進行中の技術開発が特定の関数が実施される方法を変えることが予想される。これらの例は、限定ではなく、例示の目的でここに提示されている。さらに、機能的構成要素の境界は、説明の便宜上、本明細書で任意に定義されている。指定された関数とその関係が適切に実施される限り、代替の境界を定義できる。本明細書に含まれる教示に基づいて、代替物(本明細書に記載されるものの均等物、拡張、変形、逸脱などを含む)は、関連技術の当業者には明らかであろう。かかる代替物は、開示された実施態様の範囲および精神に含まれる。また、「含む(comprising)」、「有する(having)」、「含有する(containing)」、および「含む(including)」などの単語およびその他の類似の形式は、意味が同等であり、これらの単語のいずれか1以上に続く項目が無制限であることを意味するそのようなアイテムの完全なリストであること、またはリストされたアイテムのみに限定されることを意味する。また、本明細書および添付の特許請求の範囲で使用される単数形「a」、「an」、および「the」は、文脈がそうでないことを明確に示さない限り、複数の参照を含むことに留意しなければならない。
【0077】
さらに、本開示と一致する実施態様を実行する際に、1以上のコンピュータ可読記憶媒体を使用することができる。コンピュータで読み取り可能な記憶媒体とは、プロセッサで読み取り可能な情報またはデータを格納できる任意のタイプの物理メモリを指す。したがって、コンピュータ可読記憶媒体は、本明細書に記載の実施態様と一致するステップまたは段階をプロセッサに執行させるための命令を含む、1以上のプロセッサによる実行のための命令を格納し得る。「コンピュータ可読媒体」という用語は、有形のアイテムを含み、搬送波と一時的な信号、つまり一時的でないものを除外すると理解されるべきである。例には、ランダムアクセスメモリ(RAM)、読み取り専用メモリ(ROM)、揮発性メモリ、不揮発性メモリ、ハードドライブ、CD ROM、DVD、フラッシュドライブ、ディスク、およびその他の既知の物理記憶媒体が含まれる。
【0078】
開示および実施例は例示としてのみ考慮されることを意図しており、開示された実施態様の真の範囲および精神は添付の特許請求の範囲によって示される。