【文献】
Kei Utsugi et al,SEAM CARVING FOR STEREO IMAGES,3DTV-Conference: The True Vision - Capture, Transmission and Display of 3D Video(3DTV-CON),IEEE,2010年 6月 7日,pp.1-4
(58)【調査した分野】(Int.Cl.,DB名)
【発明を実施するための形態】
【0014】
本原理は、様々な形式のハードウェア、ソフトウェア、ファームウェア、特殊目的プロセッサー、またはそれらの組み合わせで実装することができることが理解されるべきである。好ましくは、本原理は、ハードウェアおよびソフトウェアの組み合わせとして実現することができる。さらに、ソフトウェアは、好ましくはプログラム格納デバイス上で有形に実施されるアプリケーションプログラムとして実装される。アプリケーションプログラムは、任意の適したアーキテクチャを備える機械にアップロードする、およびその機械により実行することが可能である。好ましくは、機械は、1または複数の中央処理装置(CPU)、ランダムアクセスメモリ(RAM)、および入力/出力(I/O)インターフェース(複数可)などのハードウェアを有するコンピュータプラットフォーム上で実装される。コンピュータプラットフォームは、オペレーティングシステムおよびマイクロ命令コードをさらに含む。本明細書で説明される様々な処理および機能は、オペレーティングシステムによって実行される、マイクロ命令コードの一部、またはアプリケーションプログラムの一部(またはそれらの組み合わせ)のいずれかとすることができる。加えて、追加的なデータ格納デバイスおよび印刷デバイスなど、様々な他の周辺デバイスがコンピュータプラットフォームに接続することができる。
【0015】
本発明は、
リターゲティング手段を備える任意の電子デバイス上で実現することができる。例えば本発明は、テレビ、携帯テレビ電話、PDA、パーソナルコンピュータ、ディジタルビデオカメラ、ナビゲーションシステム、または自動車ビデオシステムにおいて実現することができる。
【0016】
本発明は、3Dコンテンツを
リターゲティングするための方法に関する。3つの実施形態が本明細書で開示される。2つの最初の実施形態は、2D
リターゲティング方法の拡張である。新しいステップが、容認可能な3D品質を確実にするために追加される。第3の実施形態は、3Dコンテンツ専用の
リターゲティング方法である。3Dコンテンツは、左のビューおよび右のビューから作製される。しかし本発明は、2つよりも多いビューに拡張することができる。以下では、クロッピングウィンドウが、その左上および右下の画素の座標、または、その中心の座標ならびにその高さおよび幅のいずれかである、そのパラメータにより識別される。
【0017】
すべての実施形態はクロッピングベースであり、すなわち、関心領域とも名付けられた最も重要なコンテンツを伴う元のビューの画素のサブ区域が抽出される。さらに最終的なクロッピングウィンドウは、この最終的なクロッピングウィンドウの決定が各々のビューのコンテンツに基づく場合であっても、左および右のビューに対して同一である。
【0018】
いくつかの実施形態は、視覚的注意モデルを参照する。この視覚的注意モデルは、どの区域/画素がビューの中で最も視覚的に誘引性が高いかを指示する顕著性マップ(グレーレベルマップ)を提供する。そのような顕著性マップは、ピクチャ内の関心領域を決定するために使用することができる。そのような視覚的注意モデルの例が、2005年6月30日に公開された特許文献1で開示されている。顕著性マップを提供する他の視覚的注意モデルが使用される場合がある。本発明は、特許文献1で開示されたモデルに何ら制限されない。
【0019】
図1aは、第1の実施形態による、左および右のビューを含む3Dコンテンツを
リターゲティングする方法を表す。それは、各々のビューで1つのクロッピングウィンドウを得るために、独立して各々のビューに通常の2D再フレーミングを適用するステップと、次いで、各々のビューに適用されることになる最終的なクロッピングウィンドウを得るために、3Dコンテンツに関係付けられるいくつかの制約を考慮することによりすべてのクロッピングウィンドウを組み合わせるステップとを含む。
【0020】
この目的のために、ステップ10では、第1の関心領域ROI1が左のビューで決定され、ステップ12では、第2の関心領域ROI2が右のビューで決定される。
【0021】
ステップ14では、左のクロッピングウィンドウが第1の関心領域ROI1から決定され、右のクロッピングウィンドウが第2の関心領域から決定される。左のクロッピングウィンドウは、例えば第1の関心領域を包含する最小のウィンドウであり、右のクロッピングウィンドウは、第2の関心領域を包含する最小のウィンドウである。
【0022】
ステップ18では、左および右のクロッピングウィンドウが、平滑化されたクロッピングウィンドウに組み合わされる。このステップの間、3Dコンテンツに結び付けられた以下の制約が考慮され、すなわち、左および右のクロッピングされたビューの間では垂直視差が許されず、各々のビューのクロッピングウィンドウは、同じ高さおよび同じ垂直座標を有する。
【0023】
クロッピングウィンドウ組み合わせ(CombineCroppingWindow)ステップ18は、ステップ14および16で別々に各々のビューに適用された2D再フレーミングに対する結果を入手し、2つのクロッピングウィンドウを、中心座標が(x
smooth,y
smooth)であり、サイズ(高さおよび幅)が(h
smooth,w
smooth)である平滑化されたクロッピングウィンドウに数学的に組み合わせる。(x
left,y
left)は左のクロッピングウィンドウの中心座標であり、(x
right,y
right)は右のクロッピングウィンドウの中心座標である。(h
left,w
left)は左のクロッピングウィンドウの高さおよび幅であり、(h
right,w
right)は右のクロッピングウィンドウの高さおよび幅である。
【0025】
変形例によると、最小値および最大値が式(8)のように入手される。同じクロッピングウィンドウが、両方のビューに適用される。したがって、左および右のクロップビューの間に垂直視差は存在しない。
【0026】
平滑化されたクロッピングウィンドウを決定するための別の方途は、どのクロッピングウィンドウが、その内側で利用可能な顕著性量を最大化するかを決定することである。クロッピングウィンドウ座標は、以下の式で説明されるように、2つのビューの間で初期に決定される最小のxおよびy座標、ならびに最大のxおよびy座標から変動する。
【0028】
ただし、x1
min<x1<x1
max;y1
min<y1<y1
max;x2
min<x2<x2
max;y2
min<y2<y2
max、
【0030】
SM
left(x,y)は左のビューでの画素(x,y)の顕著性値であり、SM
right(x,y)は右のビューでの画素(x,y)の顕著性値である。(x1,y1)は平滑なクロッピングウィンドウの左上の画素の座標であり、(x2,y2)は平滑なクロッピングウィンドウの右下の画素の座標である。(x1
left,y1
left)は左のクロッピングウィンドウの左上の画素の座標であり、(x2
left,y2
left)は左のクロッピングウィンドウの右下の画素の座標である。(x1
right,y1
right)は右のクロッピングウィンドウの左上の画素の座標であり、(x2
right,y2
left)は左のクロッピングウィンドウの右下の画素の座標である。
【0031】
ステップ20では、左および右の両方のビューが、平滑化されたクロッピングウィンドウにより範囲設定された部分を各々のビューで抽出することにより、左のクロップビューおよび右のクロップビューにクロッピングされる。
【0032】
第1の実施形態は、実装するのが簡単かつ早い。
【0033】
図1bは、第1の実施形態の特定の実装による、左および右のビューを含む3Dコンテンツを
リターゲティングする方法を表す。それは、各々のビューで1つのクロッピングウィンドウを得るために、独立して各々のビューに通常の2D再フレーミングを適用するステップと、次いで、各々のビューに適用されることになる最終的なクロッピングウィンドウを得るために、3Dコンテンツに関係付けられるいくつかの制約を考慮することによりすべてのクロッピングウィンドウを組み合わせるステップとを含む。この特定の実装では、第1および第2の関心領域が顕著性マップを使用して決定される。
【0034】
この目的のために、ステップ10では、左の顕著性マップが左のビューに対して決定され、ステップ12では、右の顕著性マップが右のビューに対して決定される。両方の顕著性マップは、例えば特許文献1のモデルを使用して決定される。したがって、顕著性マップは、ピクチャ内の顕著な領域を指示する。
【0035】
ステップ14では、左のクロッピングウィンドウが左の顕著性マップに基づいて決定され、ステップ16では、右のクロッピングウィンドウが右の顕著性マップに基づいて決定される。各々のクロッピングウィンドウの位置は、そのCropWind座標により対応するビューで識別される。クロッピングウィンドウは、例えば2007年3月21日に公開された特許文献2で開示された再フレーミング方法の1つを使用して決定される。例として、最も顕著な画素は顕著性マップで識別される、すなわち顕著性マップ内部でのその顕著性値は最も高い。予め規定されたサイズの第1のウィンドウは、その中心がこの最も顕著な画素上に配置されるようにビュー内で位置決めされる。第1のウィンドウに関連付けられる顕著性値SM1およびビューに関連付けられる顕著性値SM
viewが計算される。比
【0037】
が1に近い、すなわち閾値Tより高いならば(例えばΨ0≧0.8であるならば)、ビューに対するクロッピングウィンドウは第1のウィンドウである。Ψ
0が1に近くない、すなわちTより低いならば、第1のウィンドウと同じサイズの第2のウィンドウが、その中心が、第1のウィンドウの外側に配置されるビューの最も顕著な画素上に配置されるようにビュー内で位置決めされる。第2のウィンドウに関連付けられる顕著性値SM2が計算される。比
【0039】
が1に近いならば、ビューに対するクロッピングウィンドウは、第1および第2のウィンドウを含む、より小さなウィンドウである。比Ψ
1が1に近くないならば、第3のウィンドウは、その中心が最初の2つのウィンドウの外側に配置されるビューの第3の最も顕著な画素上に配置されるようにビュー内で位置決めされる。3つのウィンドウに関連付けられる3つの顕著性値の和と顕著性値SM
viewとの間の比が1と比較される。それが1に近いならば、ビューに対するクロッピングウィンドウは、3つのウィンドウを含む、より小さなウィンドウである。それが1に近くないならば、各々の位置決めされたウィンドウに関連付けられる顕著性値の和とSM
viewとの間の比が1に近くなるまで、新しいウィンドウを位置決めする処理が繰り返される。したがって各々の反復kでは、新しいウィンドウが、その中心が、すでに位置決めされたウィンドウの外側に配置される最も顕著な画素(k)上に配置されるようにビュー内で位置決めされる。したがって、ビューに対するクロッピングウィンドウは、すべての位置決めされたウィンドウを含む、より小さなウィンドウである。他の方法が使用される場合があり、本発明は、顕著性マップに基づくクロッピングウィンドウの位置を決定するためのこの方法に何ら制限されない。
【0040】
ステップ18では、左および右のクロッピングウィンドウが、平滑化されたクロッピングウィンドウに組み合わされる。このステップの間、3Dコンテンツにリンク付けられた以下の制約が考慮され、すなわち、左および右のクロッピングされたビューの間では、垂直視差が許されず、各々のビューのクロッピングウィンドウは、同じ高さおよび同じ垂直座標を有する。
【0041】
クロッピングウィンドウ組み合わせステップ18は、ステップ14および16で別々に各々のビューに適用された2D再フレーミングに対する結果を入手し、2つのクロッピングウィンドウを、中心座標が(x
smooth,y
smooth)であり、サイズ(高さおよび幅)が(h
smooth,w
smooth)である平滑化されたクロッピングウィンドウに数学的に組み合わせる。(x
left,y
left)は左のクロッピングウィンドウの中心座標であり、(x
right,y
right)は右のクロッピングウィンドウの中心座標である。(h
left,w
left)は左のクロッピングウィンドウの高さおよび幅であり、(h
right,w
right)は右のクロッピングウィンドウの高さおよび幅である。
【0043】
変形例によると、最小値および最大値が式(8)のように入手される。同じクロッピングウィンドウが、両方のビューに適用される。したがって、左および右のクロップビューの間に垂直視差は存在しない。
【0044】
平滑化されたクロッピングウィンドウを決定するための別の方途は、どのクロッピングウィンドウが、その内側で利用可能な顕著性量を最大化するかを決定することである。クロッピングウィンドウ座標は、以下の式で説明されるように、2つのビューの間で初期に決定される最小のxおよびy座標、ならびに最大のxおよびy座標から変動する。
【0046】
ただし、x1
min<x1<x1
max;y1
min<y1<y1
max;x2
min<x2<x2
max;y2
min<y2<y2
max、
【0047】
SM
left(x,y)は左のビューでの画素(x,y)の顕著性値であり、SM
right(x,y)は右のビューでの画素(x,y)の顕著性値である。(x1,y1)は平滑なクロッピングウィンドウの左上の画素の座標であり、(x2,y2)は平滑なクロッピングウィンドウの右下の画素の座標である。(x1
left,y1
left)は左のクロッピングウィンドウの左上の画素の座標であり、(x2
left,y2
left)は左のクロッピングウィンドウの右下の画素の座標である。(x1
right,y1
right)は右のクロッピングウィンドウの左上の画素の座標であり、(x2
right,y2
left)は左のクロッピングウィンドウの右下の画素の座標である。
【0048】
ステップ20では、左および右の両方のビューが、平滑化されたクロッピングウィンドウにより範囲設定された部分を各々のビューで抽出することにより、左のクロップビューおよび右のクロップビューにクロッピングされる。
【0049】
第1の実施形態は、実装するのが簡単かつ早い。
【0050】
図2は第2の実施形態を表す。第1の実施形態のステップと同一のステップは、同じ参照番号によって
図2で識別される。
【0051】
ステップ10では、左の顕著性マップが左のビューに対して決定され、ステップ12では、右の顕著性マップが右のビューに対して決定される。
【0052】
ステップ22では、各々のビューに対する視覚的注意モデルから生じる2つの顕著性マップが、3D顕著性情報を顕著性マップの2D表現によって記述する、一意的な顕著性マップに組み合わされる。VAM3Dに対する組み合わせ(CombineForVAM3D)ステップ22は、2つの顕著性マップに存在する共通の区域を強調表示して、一意的な2D顕著性マップを生成する。ステップ22の間に、両方の顕著性マップは、2つのビューで共通して顕著である一部の区域を強調表示する2Dマップである一意的な顕著性マップ(SaliencyMap_3Dlike)に統合される。例として、SaliencyMap_3Dlike内の画素(x,y)に対する顕著性値SM
3Dlike(x,y)は次式のように規定される。
(3) SM
3Dlike(x,y)=α・SM
left(x,y)+β・SM
right(x,y)
ただし、
【0054】
であり、SM
left(x,y)は左の顕著性マップ内の画素(x,y)の顕著性値であり、SM
right(x,y)は右の顕著性マップ内の画素(x,y)の顕著性値であり、DM(x,y)は場所(x,y)でのデプス値である。
【0055】
ステップ24では、平滑化されたクロッピングウィンドウが、SaliencyMap_3Dlikeに基づいて決定される。ステップ24は例えば、顕著性マップがSaliencyMap_3Dlikeであることを除けばステップ14または16と同一である。
【0056】
ステップ20では、左および右の両方のビューが、平滑化されたクロッピングウィンドウにより範囲設定された部分を各々のビューで抽出することにより、左のクロップビューおよび右のクロップビューにクロッピングされる。
【0057】
図3は第3の実施形態を表す。この実施形態は3Dコンテンツ専用である。クロッピングウィンドウ拡張に関する決定は、場合によってはデプスマップを使用する。3次元データは、平滑化されたクロッピングウィンドウを決定するために使用される。
【0058】
第1の実施形態のステップと同一のステップは、同じ参照番号によって
図2で識別される。
【0059】
ステップ10では、第1の関心領域ROI1が左のビューで決定され、ステップ12では、第2の関心領域ROI2が右のビューで決定される。変形例によると、左の顕著性マップが左のビューに対して決定され、ステップ12では、右の顕著性マップが右のビューに対して決定される。
【0060】
ステップ30では、禁止区域マップ生成(CreateForbiddenAreaMap)と呼ばれるステップが、マップを再フレーミング3Dステップ32に提供し、ステップ32は、いくつかの3D制約の尊重、すなわち物体が、この物体がスクリーンの前面にある場合はクロッピングウィンドウの境界上にあることが許されないということを確実にする。実際、人間脳はそのことを処置することができない。禁止区域マップが、左または右のいずれかでビューのうちの1つから生成される。
図3および
図4では、禁止区域マップが左のビューから生成されるが、同じことを右のビューから行うことができる。
【0061】
ステップ30は、
図4で詳細に説明される。それは、物体(
図5での右の画像の白色画素)上などの、クロッピングウィンドウを配置することができない禁止区域マップを規定する。
【0062】
ステップ300では、非特許文献1で開示されているような色セグメンテーションアルゴリズムが、セグメンテーションマップを得るために使用される。セグメンテーションマップを提供する任意の他の方法が使用される場合がある。セグメンテーションマップは、ビューのうちの1つに適用される。
【0063】
ステップ302では、顕著性値が、セグメンテーションマップ内で識別される各々の色領域に対して計算される。例として、与えられた領域に属する画素の顕著性値が平均される。平均化された値が、領域の顕著性値とみなされる。
【0064】
ステップ304では、領域の顕著性値が閾値処理される。領域の顕著性量(または顕著性の平均)が閾値Tを上回るならば(閾値処理ステップ)、最終的な禁止マップがこの領域では1(または255、白色画素)にセットされる。禁止物体を伴うそのような白黒マップが、
図5に表される。以下の式は、適応性のある閾値Tの計算を要約したものである。
【0066】
ただしμRおよびσ
Rは、それぞれ領域Rの平均および標準偏差である。μRおよびσ
Rは、セグメンテーションのために使用されるビューに関連付けられる顕著性マップから計算される。
【0067】
ステップ32では、平滑化されたクロッピングウィンドウが決定される。このステップ32は、
図6で詳細に説明される。
【0068】
ステップ322では、第1のクロッピングウィンドウが、独立して各々のビューに対して決定される。ステップ322の目標は、各々のビューに対して、ステップ10および12で決定される関心領域、または、その顕著性マップSM(x,y)からの幅Wおよび高さHの検討されているビューS(x,y)の最も目立つ部分のいずれかを囲むクロッピングウィンドウを規定することである。この目的のために、クロッピングウィンドウは、場合によっては第1および第2の関心領域を囲む最小のウィンドウである。
【0069】
多くの2D再フレーミング方法を適用することが可能である。例として顕著性マップは最初に、最も顕著な区域を識別するために2値化される。閾値より大きな顕著性値を有する画素は、2値化されたマップにおいて255にセットされる。すべての識別された顕著な区域、すなわち白色画素を含む最小のウィンドウが第1のクロッピングウィンドウである。
【0070】
変形例によると、ウィナーテイクオールアルゴリズムが、W×H個の候補の中から1<k<KであるK個の区域A
kを選択するために、特別の目的をもって用いられる。この選択は2つのステップから構成される。第1に、ビューS(x,y)が画素単位で走査され、各々の画素位置p(x,y)で、第2の特徴がピクチャの中心に対する現在の画素のユークリッド距離であるような特徴ベクトル
【0072】
が計算される。最も高い顕著性値および中心に対する最小距離を有する最初のK個の画素を伴うサブセットMが、式(4)により説明されるように計算される。第2に、第kの候補C
kが配置かつ記憶されるとき、A
kに含まれる画素を意味するその近傍は、第(k+1)の候補C
k+1を決定するために抑制される。A
kは、視角の1度に等しい半径を有する円内の画素のセットである。近傍のサイズは視距離によって決まる。視距離が遠くなるほど、近傍のサイズは大きくなる。
【0074】
顕著性マップは最大値での多くの画素を有する場合があり、したがってピクチャの中心により近い画素が優遇される。シーン中心のバイアスが重要な役割を有し、観察者は、顕著性がヌルである場合でもシーンの中心の付近を凝視する傾向がある。
【0075】
反復数(または換言すれば数K)に関しては、クロッピングウィンドウのサイズへのこのパラメータの影響を明白にすることが重要である。反復数がわずかである(または換言すれば、場所の数Kがわずかである)ならば、おそらくクロッピングウィンドウのサイズは小さくなる。それとは反対に、大きな数の反復は、より大きな境界ボックスをおそらく確実にすることになる。この方法は好都合であるように思われるが、1つの特徴、すなわち、顕著性マップ内の顕著の分布が明らかに無視されている。この特徴は、2つの異なる画像を表す
図7によって例示される。実際、顕著性の分布(または平均観察者変動性)は、風景のピクチャに関してはおそらく点在する状態である。換言すれば、ピークの顕著性と平均背景レベルとの間の分離が重要である。明らかに突出するものがない風景の画像に関しては、顕著性の分布はより均一である。この場合、K個の最初の場所を選択することが、誤りを含む結果をもたらす可能性がある。この問題を解決するために、反復が、境界ボックスにより囲まれる顕著の分量によりモニターされる。したがってKは、前の区域A
1・・・kにより包含される顕著性量SQにより制約される。関係式(3)が検証されない一方で、反復処理は継続する。Kは、
【0079】
であるように、クロッピングウィンドウ内にPパーセントの顕著性を有するために調整される。
【0080】
Pは、0<P<1であるような、マップの全顕著性量SQ
totalに適用される最大の量である。そのようなクロッピングウィンドウの例が、
図7に例示される。
【0081】
ステップ324では、左および右のクロッピングウィンドウが、左上の座標(x
LR,y
LR)、高さh
LR、および幅w
LRの中間クロッピングウィンドウに組み合わされる。左および右のクロッピングウィンドウの組み合わせは、各々のxおよびy成分にmaxおよびmin演算子を適用することにより行われる。
【0083】
別の解決策は、クロッピングウィンドウ組み合わせモジュールの式(1)の解を適用することである。
【0084】
ステップ326では、クロッピングウィンドウのパラメータ(位置、サイズ)が経時的にフィルタリングされる。このステップは、時間的整合性(temporal consistency)と呼ばれる。時間的整合性は、クロッピングウィンドウの位置およびサイズの両方に作用し、経時的な中間クロッピングウィンドウ座標/サイズの安定化を含む。時間はインデックスiにより識別される。時間的整合性は、例えば2つの順次的なステップ、すなわちカルマンフィルタリングおよび非線形フィルタリングを含む。
【0085】
カルマンフィルターは、現在のサンプルの軌跡をより良好に予測するために最初に適用される。カルマンフィルターは、興味を起こさせる再帰的な性質により特徴付けられる。(ウィーナーフィルターが行うことになるように)推定を提供するために前のデータのすべてに関して作動するのではなく、カルマンフィルターは、長期間の前のデータを必要としない。カルマンフィルターは、予測される出力と実際の出力との間の平均二乗誤差が最小化される線形システムである。カルマンフィルターは、予測誤差を最小化するために、システム内部の不正確さの2つの固有の発生源、すなわちプロセスノイズW
iおよび測定ノイズV
iを考慮する。以下の式ではX
iは、座標(x
iLR,y
iLR)のベクトルを、およびクロッピングウィンドウサイズ(w
iLR,h
iLR)を表象する一般名である。カルマンフィルターは、状態(式9)および測定式(式10)により規定される。
(10) X
i=A.X
i-1+W
i
(11) Z
i=H.X
i+V
i
ここでAは一定の遷移マトリックスであり、Hもまた一定の測定マトリックスである。
【0087】
WおよびV(マトリックス1×2)は、それぞれプロセスノイズおよび測定ノイズを表す。それらは独立しており、白色であり、正規確率を伴うと仮定される。それらは経験的にセットされ、関連付けられたノイズ共分散マトリックスが、RおよびQにより与えられる。カルマンフィルタリングは、非特許文献2において詳細に説明されている。
【0089】
プロセスノイズの決定は非常に困難である。本研究では、プロセスノイズ共分散は一定である。不確実性が高くなるほど、フィルターは高速に収束する。クロッピングウィンドウは、新しい顕著性変化に高速に適応する傾向を有することになる。フィルターは、それがカメラの動きに近いように考えるべきであるので、適度に高速に収束しなければならない。
【0090】
メジアンフィルタリングは、ありそうにないサンプルを回避することを可能にする改善である。カルマンフィルター単独の使用は、現実的な効果を得るのに充分ではない。非線形フィルタリングが、邪魔になる場合がある軌跡の短い増大または減少を(水平または/および垂直に)除去するために適用される。フレームにわたる長い軌跡が、自然なカメラの動きをシミュレートするために優遇される。各々のフィルタリングは、クロッピングウィンドウCW
LRi(x
LR,y
LR,w
LR,h
LR)の中心座標およびサイズに独立して適用される。このステップの結果は、平滑な空間軌跡およびサイズを伴うクロッピングウィンドウCW
TCi(x
TC,y
TC,w
TC,h
TC)=(x
smooth,y
smooth,w
smooth,h
smooth)である。
【0091】
ステップ328では、アスペクト比変換が適用される。使用される異なる変数および表記が
図8に例示される。クロッピングウィンドウは、1つの方向もしくは別の方向に、または異なる比率で各々の方向にさえ拡張される。
リターゲティングは、それがさらにデプスマップに基づくため立体的である。動機は、クロッピングウィンドウにより「切断」されることになる境界または強い視差を回避することである。関心を引き起こす解決策は、同じ視差を伴ういくつかの物体を完全に含むまたは排除することである。
【0092】
顕著性マップから抽出される中間ウィンドウのサイズと、ユーザセッティングまたはアプリケーションにより規定される最終的なアスペクト比との間に関係は存在しない(コンジョイント分析は存在しない)。実際、ステップ322は、
リターゲティングアプリケーションのアスペクト比とは完全に無相関である(
図7に表されるような)顕著性ピークの境界Akに続いて、最も重要な領域の正確な推定を遂行する。異方性の拡張が、現在の比R
SMに応じた方向でクロッピングウィンドウCW
SMi(x
SM,y
SM,w
SM,h
SM)を拡張することによりクロッピングウィンドウサイズを精密にする。拡張は、目標とされるアスペクト比R
TGを達成するための、幅または高さのいずれかに関するものである。
【0096】
が中間クロッピングウィンドウのアスペクト比であると仮定する。
【0097】
R
TG>R
SMである場合、水平の拡張が(現在の長方形の幅に関して)実行され、そうでない場合、垂直の拡張が(現在の長方形の高さに関して)行われる。水平の拡張(または垂直の拡張のそれぞれ)を仮定すると、次式を規定することが可能である。
(14) h
AR=h
SM (またはw
AR=w
SMのそれぞれ)
w
AR=w
SM+d
w (またはh
AR=h
SM+d
hのそれぞれ)
x
AR=x
SM+d
x (またはx
AR=x
SMのそれぞれ)
y
AR=y
SM (またはy
AR=y
SM+d
yのそれぞれ)
ただし、
【0100】
およびw
AR=w
SM+d
right+d
leftである。
【0101】
拡張の側が規定された後、ウィンドウを拡張するためのさらにいくつかの方途が存在する。換言すれば、d
rightおよびd
leftは異なる様式で計算することができる。
幅w
SMが、最終的なアスペクト比を達成するために拡張されなければならないと仮定する。
【0102】
デプスマップおよび/または禁止区域マップが、1つの方向または別の方向でクロッピングウィンドウを拡張するために使用される。
【0103】
デプスマップは、使用されるケースに応じて、利用可能である場合があればそうでない場合もある。その結果として、アスペクト比変換ステップ328の2つの変形例、すなわち、デプスマップが利用可能でないときに使用されるもの、および、デプスマップが利用可能であるときのものが開示される。
【0104】
デプスマップが利用可能でないとき、ステップ30の禁止区域マップのみが使用される。平滑化されたLRCoord(SmoothedLRCoord)ウィンドウの近辺の画素の列内の勾配の和(大域的な勾配すなわちGG)が、各々の拡張側の量および表現を特徴付けるために計算される。同じことが水平に適用することができる。最適なクロッピングウィンドウCW(x
opt,y
opt)が、以下の最小化の問題が(y
opt=y
SMと仮定して)解を有するときに見出される。
【0106】
実際、(目標アスペクト比での)ウィンドウは、式(14)が最小化されるように、区間[x
SM−dw−w
SM/2;x
SM−w
SM/2]内で、x軸のもとで水平移動を行うことにより決定される。d
wは最大の拡張幅である。
【0107】
対応するx
minは、最適なクロッピングウィンドウの左側である。したがって、
x
opt=x
SM+d
x(式(13)で規定されたd
x)
d
left=x
SM−x
min−w
sm/2
d
right=d
w−d
left
である。
【0108】
変形例によると、d
rightが、式(14)が最小化されるように、区間[x
SM+w
SM/2;x
SM+dw+w
SM/2]内で、x軸のもとで水平移動を行うことにより最初に決定される。
【0109】
最小化問題に対する解が存在しないとき、拡張は各々の側に対して等しく行われ、このことはd
left=d
right=d
w/2を意味する。
【0110】
デプスマップが利用可能であるとき、両方のマップに関する信頼度Conf
xが計算される。次いで、この信頼度は、最良のクロッピングウィンドウを見出すために最大化される。
(16) x
min=argmax
x[Conf
x]
ただし、
【0112】
実際、(目標アスペクト比での)ウィンドウは、式(15)が最大化されるように、区間[x
SM−dw−w
SM/2;x
SM−w
SM/2]内で、x軸のもとで水平移動を行うことにより決定される。d
wは最大の拡張幅である。
【0113】
対応するx
minは、最適なクロッピングウィンドウの左側である。したがって、
x
opt=x
SM+d
x((13)で規定されたd
x)
d
left=x
SM−x
min−w
sm/2
d
right=d
w−d
left
である。
【0114】
変形例によると、d
rightが、式(15)が最大化されるように、区間[x
SM+w
SM/2;x
SM+dw+w
SM/2]内で、x軸のもとで水平移動を行うことにより最初に決定される。
【0115】
ステップ20では、左および右の両方のビューが、平滑化されたクロッピングウィンドウにより範囲設定された部分を各々のビューで抽出することにより、左のクロップビューおよび右のクロップビューにクロッピングされる。
【0116】
図9は、左上手側に顕著性マップを、右上側に第1の顕著性ピークおよび対応する第1のクロッピングウィンドウを表す(ステップ322)。左下側画像は、禁止区域マップ、および、最終的なクロッピングウィンドウとなるためにいくつかの量を最小化しなければならないスライディングウィンドウである。右下側は、物体の切断を回避するための最終的な左および右の選定された量を提示する。実際、禁止区域マップは、最終的なクロッピングウィンドウ境界が回避すべき領域を(白色で)指示する。
【0117】
本発明による
リターゲティング方法は、完全に自動的であり、シーンの大域的な理解に関して欠落している基本的な部分がない良好な最終的な品質を確実にし、黒線を用いる異形と比較して3D効果および没入型の体感を改善する。
【0118】
本発明は有利には、以下のような多くのポストプロダクション作業に対してのものであり得る。
・アスペクト比変換のためのコンテンツ準備。TV所有者は、そのコンテンツが、キャッチアップTVおよびVODの場合でのインターネット、携帯TV、通常のTVチャネル・・・などのいくつかのサポートに対して再フォーマットされることを評価するであろう。
・blu−rayディスクのためのコンテンツ準備。劇場アスペクト比からTVアスペクト比へのアスペクト比変換が、blu−rayサポートの準備で必要とされる。
【0119】
図10は、本発明による
リターゲティングデバイス2を図表で例示する。
リターゲティングデバイス2の本質的な要素のみが、
図10に図示される。
リターゲティングデバイス2は、アドレスおよびデータバス24により一体に接続される、
− マイクロプロセッサ(またはCPU)などの処理装置21と、
− ROM(読出し専用メモリ)タイプの不揮発性メモリ22と、
− ランダムアクセスメモリ(RAM)23と、
− 入力および出力インターフェース25と、
− 場合によってはマンマシンインターフェース26と、
を備える。
【0120】
メモリ22および23の説明で使用される単語「レジスタ」は、述べられるメモリの各々において、低容量のメモリゾーン(いくらかのバイナリーデータ)および大容量のメモリゾーン(プログラム全体、または、受信されるオーディオ/ビデオサービスを表すデータの全部もしくは一部が格納されることを可能にする)を表すことが留意される。
【0121】
不揮発性メモリ22は、本発明による
リターゲティング方法のステップを実現するアルゴリズムを包含する。電源投入されるとき、処理装置21はこれらのアルゴリズムの命令をロードしランさせる。ランダムアクセスメモリ23は、デバイスの電源投入でロードされる処理装置21の動作プログラム、および、処理されることになる、すなわち
リターゲティングされることになる画像を特に含む。入力/出力インターフェース25の機能は、入力信号(すなわち再フレーミングされることになる1または複数の画像)を受信し、本発明による方法のステップ10から20によって
リターゲティングされる1または複数の画像を発出することである。
リターゲティングデバイス2のマンマシンインターフェース26は、操作者が、必要条件に適合しない
リターゲティング誤りが発生すると直ちに処理を中断することをイネーブルする。このインターフェースは、操作者が、テキストゾーンおよび顔などの認知情報を、このインターフェースを使用して手動で識別することをさらにイネーブルにし得る。
リターゲティングされた画像は、ランダムアクセスメモリに格納され、次いで場合によっては、読出し専用メモリに転送されて、後続の処理動作の目的でアーカイブされる。マンマシンインターフェース26は、場合によっては制御パネル、例えばキーボードおよびディスプレイスクリーンを備える。
【0122】
変形例によると、本発明に適合する
リターゲティングデバイスは、純粋にハードウェアの実現によって、例えば専用構成要素(例えばASIC(特定用途向け集積回路)、FPGA(フィールドプログラマブルゲートアレイ)、VLSI(超大規模集積回路))、もしくはデバイスに集積されたいくつかの電子構成要素の形式で、またはハードウェア要素およびソフトウェア要素の混合体の形式でも実装される。
<付記1>
少なくとも第1のビューおよび第2のビューを含む3Dコンテンツを
リターゲティングするための方法であって、
− 前記第1のビューから第1の関心領域を、および前記第2のビューから第2の関心領域を決定するステップ(10、12)と、
− 前記第1の関心領域から第1のクロッピングウィンドウを、および前記第2の関心領域から第2のクロッピングウィンドウを決定するステップ(14、322、16、322)と、
− 前記第1のクロッピングウィンドウおよび前記第2のクロッピングウィンドウを最終的なクロッピングウィンドウに組み合わせるステップ(18、324)と、
− 前記最終的なクロッピングウィンドウによって前記第1のビューおよび前記第2のビューをクロッピングするステップであって、前記クロッピングされた第1のビューおよび第2のビューが前記
リターゲティングされる3Dコンテンツを形成する、ステップ(20)と、
を備える、前記方法。
<付記2>
前記最終的なクロッピングウィンドウはパラメータにより識別され、前記方法は、
− 前記最終的なクロッピングウィンドウの前記パラメータを経時的にフィルタリングするステップ(326)と、
− 最終的なクロッピングウィンドウ境界が回避すべき領域を指示する禁止区域マップを決定するステップ(30)と、
− 前記禁止区域マップを使用して、前記最終的なクロッピングウィンドウのアスペクト比を目標アスペクト比に変換するステップ(328)と、
をさらに含む、付記1に記載の方法。
<付記3>
前記最終的なクロッピングウィンドウはパラメータにより識別され、前記方法は、
− 前記最終的なクロッピングウィンドウの前記パラメータを経時的にフィルタリングするステップ(326)と、
− 最終的なクロッピングウィンドウ境界が回避すべき領域を指示する禁止区域マップを決定するステップ(30)と、
− 前記禁止区域マップおよびデプスマップを使用して、前記最終的なクロッピングウィンドウのアスペクト比を目標アスペクト比に変換するステップ(328)と、
をさらに含む、付記1に記載の方法。
<付記4>
前記禁止区域マップを決定する前記ステップ(30)は、
− 前記少なくとも2つのビューのうちの1つを領域のセグメンテーションマップにセグメント化するステップ(300)と、
− 前記セグメンテーションマップの各々の領域に対して、前記少なくとも2つのビューのうちの前記1つの顕著性マップから顕著性値を計算するステップ(302)と、
− 各々の領域に対して計算された前記顕著性値を閾値処理して、禁止区域マップを形成するステップ(304)と、
を含む、付記2または3に記載の方法。
<付記5>
前記第1の関心領域および前記第2の関心領域を決定するステップ(10、12)は、第1の顕著性マップおよび第2の顕著性マップを決定するステップを含む、付記1から4のいずれかに記載の方法。
<付記6>
少なくとも第1のビューおよび第2のビューを含む3Dコンテンツを
リターゲティングするためのデバイスであって、
− 前記第1のビューから第1の関心領域を、および前記第2のビューから第2の関心領域を決定するための手段と、
− 前記第1の関心領域から第1のクロッピングウィンドウを、および前記第2の関心領域から第2のクロッピングウィンドウを決定する手段と、
− 前記第1のクロッピングウィンドウおよび前記第2のクロッピングウィンドウを最終的なクロッピングウィンドウに組み合わせる手段と、
− 前記最終的なクロッピングウィンドウによって前記第1のビューおよび前記第2のビューをクロッピングする手段であって、前記クロッピングされた第1のビューおよび第2のビューが前記
リターゲティングされる3Dコンテンツを形成する、手段と、
を備える、前記デバイス。
<付記7>
前記最終的なクロッピングウィンドウはパラメータにより識別され、前記デバイスは、− 前記最終的なクロッピングウィンドウの前記パラメータを経時的にフィルタリングする手段と、
− 最終的なクロッピングウィンドウ境界が回避すべき領域を指示する禁止区域マップを決定する手段と、
− 前記禁止区域マップを使用して、前記最終的なクロッピングウィンドウのアスペクト比を目標アスペクト比に変換する手段と、
をさらに備える、付記6に記載のデバイス。
<付記8>
前記最終的なクロッピングウィンドウはパラメータにより識別され、方法は、
− 前記最終的なクロッピングウィンドウの前記パラメータを経時的にフィルタリングする手段と、
− 最終的なクロッピングウィンドウ境界が回避すべき領域を指示する禁止区域マップを決定する手段と、
− 前記禁止区域マップおよびデプスマップを使用して、前記最終的なクロッピングウィンドウのアスペクト比を目標アスペクト比に変換する手段と、
をさらに含む、付記6に記載のデバイス。
<付記9>
前記禁止区域マップを決定する前記手段は、
− 前記少なくとも2つのビューのうちの1つを領域のセグメンテーションマップにセグメント化する手段と、
− 前記セグメンテーションマップの各々の領域に対して、前記少なくとも2つのビューのうちの前記1つの顕著性マップから顕著性値を計算する手段と、
− 各々の領域に対して計算された前記顕著性値を閾値処理して、禁止区域マップを形成する手段と、
を備える、付記7または8に記載のデバイス。
<付記10>
前記関心領域は、顕著性マップを用いて決定される、付記6から9のいずれかに記載のデバイス。
<付記11>
プログラムコード命令を含むコンピュータプログラム製品であって、前記プログラムコード命令は、このプログラムがコンピュータ上で実行されるときに、付記1から5のいずれかに記載の方法のステップを実行するためのものである、前記コンピュータプログラム製品。
<付記12>
少なくとも付記1から5のいずれかに記載の方法のステップをプロセッサーに実行させるための命令が格納されたプロセッサー可読媒体。