(58)【調査した分野】(Int.Cl.,DB名)
前記シフトパラメータを決定する前に、ビュースケーリングファクタに依存する量だけ、前記第一のビュー及び前記第二のビューのそれぞれの解像度を変更する段階を更に含む、
請求項4記載の方法。
前記制御パラメータを、前記ユーザの不快さのプロファイルに関連するユーザの装置に送出する段階を更に含み、前記制御パラメータは、前記ユーザの装置で前記制御信号に含まれるため、ユーザの調節された制御パラメータの生成において使用される、
請求項8記載の方法。
前記ユーザの視聴の好みが生成できるように、前記プロセッサから調節された第一のビュー及び第二のビューをもつ前記少なくとも1つの立体画像の対を表示するディスプレイを更に備える、
請求項17記載のシステム。
【発明を実施するための形態】
【0013】
本発明の実施の形態は、視聴者は、視聴者自身の視覚的な快適さのレベル及び/又は視聴の好みに従って深度の範囲を調節することができる、調節可能な3Dコンテンツの方法及びシステムを提供する。深度の変化は、シフトされた画像の対が所望の深度の知覚を達成するために十分な、新たな水平方向の視差を示すように、立体コンテンツ画像の左画像及び右画像をシフトすることで達成される。画像の対において左及び右画像をシフトすることで、シーンにおけるコンテンツのオブジェクトは、シフトされていない画像の対におけるそれら同じオブジェクトよりもビューアの近くに見えるか、又はビューアから離れて見える。この技術は、立体3Dコンテンツにおける深度の知覚に関するカスタマイズを可能にする。
【0014】
深度の感覚又は知覚は、視聴プロセスの両眼の特性のため、2つの画像ビュー(すなわち左及び右の画像ビュー)間の水平方向の視差にダイレクトに関連する。両眼“binocular”は、本明細書では、視聴が目により行われるか又はカメラにより行われるかに係らず、2つの異なる位置からの視聴を広く包含することが意図される。3Dビデオにおけるオブジェクトについて、水平方向の視差、又は簡単に視差は、立体画像の対の左画像と右画像との間で、画素数で通常測定される水平方向の分離を示す。ゼロの視差は、右画像のビューが左画像のビューと一致するときに生じる。次いで、これらの画像のビューにおけるオブジェクトは、ディスプレイスクリーンに現れる。正の視差は、右目の画素が対応する画像からの左目の画素の右に現れることを示す。正の視差を示すオブジェクトは、視聴スクリーンの背後に現れる。負の視差は、右目の画素は、対応する画像における左目の画素の左に現れることを示す。負の視差を示すオブジェクトは、視聴スクリーンの前に現れる。
【0015】
この概念は、
図5において少なくとも部分的に示される。この図では、視差は、オブジェクトOと関連する。視差は、左のビュー及び右のビューを参照して画像におけるそれぞれの画素について定義される。異なる画素は、画像における同じオブジェクトについて、異なる視差の値を有する。図のdとして示される視差は、オブジェクトOの画像における左目の画素と右目の画素との間の差異として測定される。視差は、一般に画素数として表される。右目の画像における画素は左目の画像における対応する画素の右にあるので、例示される視差は、正の数である。ポイントPから左にポイントP’に左目の画像をシフトし、ポイントQから右へポイントQ’に右目の画像をシフトすることで視差が増加するとき、ポイントP’とポイントQ’との間の画素数として、Oについて新たな視差が測定される。右目画像における画素はなお左目画像における画素の右にあるので、新たな例示される視差は正の数である。この例では、オブジェクトOは、O’での新たな位置により示されるように、視聴者から遠くに追いやられる。
【0016】
本出願の時点で、視差は、シフトを参照して記載されるか、或いは、互いに関して又は参照ポイントに関して、左画像と右画像を参照して記載される。視差の測定が基づく左画像の画素と右画像の画素とを画像が含むため、これらの記載がシフトプロセスの正確な簡潔な記載として役に立つことが当業者により理解される。従って、画像のシフトは、画像の画素のシフトと同義、及び意味において同一の外延をもつことが意図される。
【0017】
文献において、視差“parallax”,“disparity”は、交換可能に使用される。本発明のコンテクストにおいて、3Dビデオにおけるオブジェクトの視差“disparity”は、左目の画像と右目の画像との間で、画素数での水平方向の分離を示し、視差“parallax”は、表示されたときに、左目の画像と右目の画像との間の実際の距離を示す。従って、オブジェクトの視差“parallax”の値は、オブジェクトの視差及びディスプレイサイズの両者に依存する。固定されたディスプレイサイズについて、視差“parallax”は、視差“disparity”に等価である、一定のファクタにより互いに関連する。
【0018】
図1は、本発明の原理に従って実現されるユーザの3D視聴体験を調節するシステムの簡略化されたブロック図である。
図1におけるシステムは、3D効果チューナ10、ユーザ装置20及びディスプレイ30を含む。3D効果チューナ10は、ユーザ装置20からの視聴者の制御信号又は指示に応答して、入力立体ビデオフレームを処理する。3D効果チューナ10は、制御信号により指示されたとき、立体ビデオフレームの視聴体験を調節する。次いで、3D効果チューナ10は、視聴者への提示のため、調節された立体ビデオフレームをディスプレイに供給する。
【0019】
表示されたコンテンツを視聴している間、視聴者は、彼/彼女の視聴の好みに基づいてコンテンツを更に調節するため、1以上の制御又は調節信号(又は命令)を送出する。特に、3Dコンテンツは、表示された立体画像(すなわち左目の画像又はビュー、及び/又は右目の画像又はビュー)の少なくとも1つを水平方向にシフトすることで、視聴者の深度の知覚の好みに適合するため、制御信号に基づいて調節される。さらに、深度が調節された画像のスケーリングは、深度の変化の調節を考慮するため、シーンにおけるオブジェクトのサイズを調節するために実行することができる。
【0020】
先に簡単に言及されたように、入力立体ビデオは、左ビューのビデオ及び右ビューのビデオを含む。左ビューのビデオにおけるそれぞれのフレームは、右ビューのビデオにおける1つの対応するフレームを有し、従ってフレームの対が形成される。本明細書で記載されたシステムにおける処理の間、フレームのそれぞれの対は、調節のために3D効果チューナ10に入力される。
【0021】
図2は、本発明の原理に従って実現される、
図1における3D効果チューナ10の詳細なブロック図である。3D効果チューナ10は、左ビューチューナ11、右ビューチューナ12、シフト計算部13及びフォーマット変換部14を含む。チューナ11及び12は、シフトパラメータを受信するためにソフト計算部13にそれぞれ結合される。それぞれのチューナからの出力は、フォーマット変換部14に結合される。
【0022】
3D効果チューナ10により受信されるそれぞれの立体3D画像の対は、左ビューの画像及び右ビューの画像といった、2つのコンポーネントに分離される。ユーザ装置20からの制御信号の受信に応じて、シフト計算部13は、少なくとも1つのシフトパラメータα
Vを計算し、ここで、下付き文字Vは、L又はRの何れかであり、すなわち、シフトパラメータは、左ビューのシフトパラメータα
L、右ビューのシフトパラメータα
Rを含む。シフト計算部13は、ユーザ装置から受信された制御信号に少なくとも部分的に基づいて、シフトパラメータα
Vを計算する。ユーザ装置20からの制御信号は、視聴者により要求された深度の変更を示すために発生される。(
図6と共に以下に詳細に説明される)1実施の形態では、制御信号は、視聴者の所望の深度の変更に関連する制御パラメータを含む。
【0023】
また、制御信号は、視聴者又はユーザ装置を識別する補助情報を含む。他の例では、制御信号は、他の個々の視聴者又は視聴者のグループを識別する。次いで、この補助の識別情報は、信号において識別される個人又は個人のグループについて記憶されたプロファイル又は視聴の好みの情報を検索するため、他の実施の形態において3D効果チューナにより使用される。係る視聴の好み及びユーザプロファイル情報は、視聴者が立体3D画像を見ることを好む好適な深度の範囲に関連する情報を含むことが想定される。
【0024】
視聴者は、システムの一部と既に相互作用して、深度の範囲に関連する情報のような視聴情報を少なくとも部分的に反映するプロファイル又は視聴のプリファレンスリストを作成する。係るケースにおいて、特定の視聴者の制御信号は、視聴者又は視聴グループを簡単に識別し、この視聴者又は視聴グループは、システムにストレージ(図示せず)から好適な深度の範囲を示す視聴情報の1以上のアイテムを検索させる。この深度の範囲は、要求された対応する深度の変更を実現する左及び右のビューについてのシフトパラメータα
Vを生成するため、シフト計算部に供給される。
【0025】
視聴者の制御信号に応答してシフトパラメータα
Vを計算する代わりに、シフトパラメータα
Vは、左のビューの対応するシフトパラメータ(α
L)及び右のビューの対応するシフトパラメータ(α
R)を生成するため、定義されたルックアップテーブルから選択され、左のビューの対応するシフトパラメータ(α
L)及び右のビューの対応するシフトパラメータ(α
R)は、次いで、対応する左ビューチューナ又は右ビューチューナに送出される。シフトパラメータの定義されたリストは、大部分の視聴者及び大部分の視聴環境にとって合理的又は適した特定の深度の変更又は画像のシフト範囲をカバーするために生成される。
【0026】
それぞれのシフトパラメータα
L又はα
Rは、正又は負の数である。α
Vの大きさは、画像のシフトの大きさを表し、α
Vの符号は、関連するビデオ画像のシフトの方向を表す。シフトパラメータの定義されたリストは、大部分の視聴者にとって合理的又は適している考えられる範囲で提供することができる。
【0027】
シフトパラメータの範囲は、計算されたか又は定義されたリストにあるかに係らず、少なくとも幾つかの異なるファクタに依存する。これらのファクタは、ディスプレイスクリーンのサイズ、視聴者とスクリーンとの間の視聴距離、及び視聴者の好み又は他の係る特性を含む。実験練習からの1例では、−300〜+300までの範囲にわたる画像のシフトは、典型的な視聴の条件下で大部分の視聴者にとって視聴の好みを満たすために一般に十分であると考えられる。他の範囲は、視聴者及びそれらの視聴環境が変化したときに、より適切になる。
【0028】
左ビューチューナ11及び右ビューチューナ12は、シフトカリキュレータ13により供給されるそれぞれのソフトパラメータα
Vに基づいて、対応する左ビューのビデオ画像及び右ビューのビデオ画像を処理する。次いで、それぞれのチューナは、適切な立体ビデオフォーマットでディスプレイ30にとって表示可能なビデオ入力を生成するため、調節された左ビュー及び右ビューをフォーマットコンバータ14に供給する。
【0029】
立体3Dコンテンツディスプレイのビデオフレームフォーマットの例は、本発明の技術分野及び関連する技術的な規格の組織において知られている。これらのフォーマットは、フルフレームフォーマットに限定されるものではないが、チェッカーボードフォーマット、インタリーブフォーマット、サイドバイサイドフォーマット、及びトップアンドボトムフォーマットを含む。フルフレームフォーマットにおいて、左目の画像及び右目の画像は、個別のフレームにおいて、フル解像度で交互にフォーマット化される。チェッカーボードのフォーマットにおいて、1フレームにおけるそれぞれ2×2画素のウィンドウは、ウィンドウの対角線を形成する一方の目のビューからの2画素と、同じウィンドウの非対角を形成する他方の目のビューからの2画素とを含む。インタリーブされたフォーマットは、行に基づいたフォーマットであり、左目の画像及び右目の画像は、同時に表示されるが、異なる交互する画素の行で表示される。サイドバイサイドフォーマットでは、左目の画像及び右目の画像は、並んで配置され、上及び下の表示について、左目の画像及び右目の画像は、交差して配置される。全てのフレームフォーマットは、フルフレームフォーマットを除いて、上述した特定のコンフィギュレーションで、両方の画像ビューを1つのフレームに圧縮する。
【0030】
ディスプレイ30は、ディスプレイスクリーンでのビューアへの提示のため、これらのフォーマットを原始フォーマットに変換する。フォーマットは埋め込み情報、メタデータ、更にはディスプレイの解像度、アスペクト比等のような他の情報を伝達する補助ファイルをも含むことが理解される。
【0031】
図3A,
図3B及び
図3Cは、
図2に示されたそれぞれのビューチューナ11及び12のブロック図の表現を更に詳細に示す。
図3Aに示されるように、左/右ビューチューナは、シフティングモジュール10、スケーリングモジュール112、スケーリングパラメータカリキュレータ111及びビデオ出力エレメント113を含む。
【0032】
シフティングモジュール110は、入力の左又は右のビデオフレーム(画像)のシフトを実行するプロセッサを含む。画像のシフトは、量α
Vだけ水平方向において行われ、下付き文字Vは、シフトパラメータについて左ビュー/画像(L)又は右ビュー/画像(R)を示す。シフトパラメータは、多数の画素におけるシフト量を一般に示し、α
Vにおけるシフトの符号は、画像のシフト方向を示す。1実施の形態では、左及び右ビューは、結果として得られる3D画像の所望の知覚された深度を達成するため、反対方向において同じ量、すなわちα
R=−α
Lだけシフトされる。左及び右ビューが異なる量だけシフトされるか、又は1つのビューのみをシフトする(すなわちシフトパラメータの一方はゼロ)ことも可能である。
【0033】
また、スケーリングパラメータ112は、(例えば更に離れてシフトされるコンテンツが小さなサイズにスケーリングされるといった)立体コンテンツのより自然な外観を生成するため、シフトされたビデオをスケーリングするプロセッサを含む。このスケーリング演算で使用されるスケーリングパラメータγは、シフトパラメータα
Vに応答して、スケーリングパラメータカリキュレータ111により生成される。
【0034】
図3Aに示される例示的な実施の形態は、画像のシフト後に実行されるスケーリングを示しているが、画像のスケーリングは画像のシフトの前に実行される場合もあることを、これらの変換演算の線形の性質から理解されたい。この交互する例示的な実施の形態は、
図3Bに例示される。スケーリングパラメータは、シフトパラメータに少なくとも部分的に依存するので、
図3Bにおける実施の形態はスケーリングモジュール12に先行するスケーリングパラメータカリキュレータ111を示すことを理解されたい。さらに、左ビューのビデオ画像及び右のビューのビデオ画像は、シフトモジュール110の代わりにスケーリングモジュール112に供給される。
【0035】
これらの図で示される3D効果チューナ及び各種モジュール及び処理ユニットは、本発明の原理に従って実現されたとき、3D効果チューナに関連する一部又は全部の機能を実行する1以上のプロセッサ及びストレージデバイスのようなコンポーネントを含むことを理解されたい。
【0036】
図3Cは、3D効果チューナの別の例示的な実施の形態を示す。この実施の形態では、前処理ユニット114は、
図3Aからのエレメントの構成に先行する。前処理ユニット114は、
図3Bに示されるアレンジメントに追加されることを理解されたい。前処理ユニット114は、(
図2に示される)左ビューの画像及び右ビューの画像を受信して、ピクセルカウント又は画像の解像度を増加するために十分な量だけそれぞれのビデオをスケーリングする。言い換えれば、前処理ユニットは、その特定のビューのビデオで実行されるべきシフト動作を収容するため、より大きな左ビューのビデオ又は右ビューのビデオを作成する。
【0037】
このスケーリング動作は、スケーリングモジュール112により実行されるスケーリングとは異なる。以下に更に説明されるように、スケーリングモジュール112は、所与のシーンについて深度の変化に一致したより自然の外観を提供するため、左及び右のビューのサイズを調節(増加又は減少)する。前処理ユニット114は、出力ビデオにおけるゼロパディングの必要を回避又は最小化するため、左及び右のビューのサイズ及び解像度を増加する(例えばゼロパディングは、左又は右のビューのシフト後にコンテンツが欠けていることとなる出力フレームにおける領域において必要となる)。スケーリングモジュール112によるスケーリングは深度又は視差において調節された(1以上の)シーンで実行され、スケーリングファクタは、視差又は深度の調節に関連する一方、前処理ユニット114によるサイズの増加は、視差又は深度の調節に係らず、(例えばコンテンツの第一のシーンの左及び右のビューのシフトのような他の処理の前に)1度だけ実行されることが好ましい。しかし、前処理ユニットは、必要に応じて、その後のシーンについて更なるサイズの増加を行うこともできる。可能な混乱を回避するため、前処理ユニット114により行われるスケーリングは、「ビュースケーリング」とも呼ばれ、
図4に関してさらに詳細に説明される。
【0038】
シフトモジュール110は、α
V画素だけ水平方向に入力の左ビューのビデオ/右のビューのビデオをシフトする。入力ビデオに依存して、シフトモジュールによる入力ビデオの処理の間に遭遇する少なくとも3つの可能なケースが存在する。これらのケースは、
図4A〜
図4Fにおいて更に詳細に示され、これらの図は、それぞれ3Dビューの異なる条件下での入力ビデオフレーム及び出力ビデオウィンドウの比較を示す。
【0039】
図4Aは、入力ビデオフレーウABCD(フレーム40)が、出力ウィンドウ41として示される、ディスプレイによりサポートされるサイズ又は解像度よりも大きいサイズ又は解像度を有する第一のケースを示す。
図4Aでは、入力ビデオフレームABCD(フレーム40)は、水平方向におけるM画素の幅と、垂直方向におけるN画素の高さとを表す、M×Nとして示される解像度又はサイズを有する。左のビューと右のビューのディスプレイのビュー出力ウィンドウ41は、水平方向におけるm画素の幅と、垂直方向におけるn画素の高さとを表すm×nとして示される、解像度又はサイズをもつ出力ウィンドウEFGHとして示される。
図4Aのこのシナリオでは、フレーム及びウィンドウの寸法は、M>m及びN>nのように関連する。
【0040】
図4Aの記載では、出力ビデオウィンドウ41は、入力ビデオフレーム40から見ることができる情報の範囲を確定することが理解される。シフト動作が記載されるとき、画素のシフトは、例えば
図4B及び
図4Cにおけるシフトされた出力ビデオウィンドウ41’として示される、出力ビデオウィンドウの入力ビデオフレームを通して新たな位置へのシフトとして考えられる。この動作は、ビデオ画像のシフトとして記載される。勿論、シフト動作は、画像の上のウィンドウのシフト又はウィンドウの下の画像のシフトとして理解することができることを理解されたい。これらは、同じ結果、すなわちシフトされた左ビューのビデオ画像又は右ビューのビデオ画像が得られる交換可能な概念である。両方の概念は、矛盾することなしに、本発明の原理に関する意図された制限なしに、本明細書において交換可能に記載される。
【0041】
深度の知覚は、2つのビュー(左及び右)の水平方向の視差によってのみ影響されるので、シフトモジュール110は、水平方向のシフトのみを行う。従って、本発明の記載は、入力ビデオと表示されたビデオの水平方向の解像度及び寸法に焦点を当てる。この例では、入力ビデオフレームの水平方向の寸法は、M>mにより示されるように、出力ウィンドウEFGHの寸法よりも大きい。シフトされたビデオフレーム“E’F’G’H”が
図4Bに示されるように、なお
図4Bに示されるように入力ビデオフレームABCD内にあるように、が表示ビデオがα
V画素だけシフトされた場合、表示されたビデオは、出力ウィンドウ41’(すなわちE’F’G’H’)とマークされた部分に対応する。
【0042】
シフトパラメータが余りに大きく、シフト動作の後に、出力ウィンドウE’F’G’H’が入力ビデオフレーム40の境界を越えて延びる場合、
図4Cにおける影付けされた領域に示されるギャップを埋めるためにゼロパディングが使用される。他の適切な充填の技法をゼロパディングの代わりに使用することができる。シフトされた出力ウィンドウ41’のギャップ部分は入力ビデオコンテンツをカバーしないため、このケースではゼロパディングが使用される。このギャップ領域における画素がゼロに設定されるとき、これらの画素はブラックとして現れる。ディスプレイに供給される出力ビデオは、E’F’G’H’に対応し、ゼロが充填された画素の暗く影付けされた部分を含む。
【0043】
右ビュー及び左ビューは反対方向にシフトされるので、シフトされた右ビュー及び左ビューにおけるコンテンツは互いに十分に異なることができ、両方のビューが同じコンテンツを実質的に有することを保証するため、(ゼロパディングに加えて)右ビュー及び左ビューのトリミングが必要とされる。
【0044】
図4Dは、入力ビデオフレームABCD(フレーム40)の少なくとも水平方向の寸法又は解像度が、M=mであるように、出力ウィンドウEFGH(ウィンドウ41)の寸法に等しい第二のケースを示す。この例にとって便宜上、必須ではないが、n=Nとなるように、フレーム40は、出力ウィンドウ41の垂直方向の解像度に等しい解像度を有する。この例では、左ビュー又は右ビューの何れかにおける非ゼロのシフト値α
Vにより、ビデオ出力ウィンドウフレームE’F’G’H’として示される、シフトされた出力ウィンドウ41’は、入力ビデオフレーム40の境界から外れる。
図4Dの影付けされた部分に示されるように、ギャップ部分において充填するため、ゼロパディング又は他の適切な充填の技法が使用される。
【0045】
図4Eは、オリジナルの入力ビデオフレームABCD(フレーム40)の寸法がM=m及びN=nとなるように、出力ウィンドウEFGHの寸法に整合する。このオリジナルの入力ビデオフレームABCDを、
図4Dに関連して記載される処理のために左ビューチューナ及び右ビューチューナにダイレクトに提供する代わりに、入力ビデオフレームABCDは、前処理ユニット114によるビュースケーリング動作を最初に受け、それぞれの画像ビュー(すなわち左及び右)のその寸法は、それらのオリジナルの寸法M×Nからビュースケーリングファクタにより、M’>M及びN’>Nの場合により大きな寸法M’×N’にそれぞれスケールアップされる。さらに、このビュースケーリングは、
図3A、
図3B及び
図3Cに示されるスケーリングモジュール112により実行されたスケーリング動作とは異なる。ビュースケーリングは、入力ビデオフレームサイズ又は解像度Mと出力ウィンドウのサイズmとの間の関係に係らず、入力ビデオ画像に適用される。出力ウィンドウサイズに関して大きな入力ビデオフレームサイズは、画像シフト後のギャップの可能性を減少させ、これは、ギャップにおけるゼロパディングの可能な必要を減少させる。
【0046】
この例では、その寸法が
図4Eに示されるように、出力ウィンドウEFGHの寸法よりも大きいように、入力ビデオフレームABCDが増加される。その後のシフト動作は、
図4B及び
図4Cに関して第一のケースについて記載されたのと同じステップに従う。ビュースケーリングファクタM’/Mは、ビュースケーリングファクタN’/Nと同じであるか、又は異なる。ビュースケーリングファクタM’/M及びN’/Nが同じである場合、入力ビデオフレームのアスペクト比は保存される。
【0047】
実験練習からの例では、シフトモジュールは入力ビデオフレームについて、このスケーリングを実行するプロセッサを含むことがわかる。代替的に、このビュースケーリングは、
図3Cに示されるように、前処理ユニットにより実行することができる。
【0048】
図3Cは、前処理ユニット114は、シフティング及びスケーリングモジュールのアップストリームに設けられる。このコンフィギュレーションにおいて、前処理ユニットは、入力ビデオフレームの寸法のスケーリングを実行するプロセッサを含む。前処理ユニット114からのスケーリングされた右ビュー/左ビューのビデオフレームは、更なる処理のためにシフトモジュールへの入力として提供される。
【0049】
スケーリングモジュール112は、画像のシフトによる深度の知覚について調節されているビデオの外観を改善するために導入される。シンプルな画像のシフトは、「スケールダウン」又は「スケールアップ」効果を引き起こす。係るスケーリング効果の存在は、シフトがこれらのオブジェクトをビューアに近くするため、所定のオブジェクトが本来よりも小さく現れることになり、他のオブジェクトは、ビューアから離れてシフトされたときに、本来よりも大きく現れる。この効果を軽減するため、スケーリングモジュール112は、深度が調節されたビデオのより自然な外観を生成するため、シフトプロセスと共に使用される。言い換えれば、モジュール112におけるスケーリング又はサイズの調節動作は、その画像がシフトされるシーン(又はフレームにおける全ての画素)で実行され、シーンにおける全てのオブジェクトのサイズは、観察されるスケールダウン及びスケールアップ効果を弱めるために調節される。このスケーリング動作は、
図3A,
図3B及び
図3Cに示されるように、右画像及び/左画像がシフトモジュールによりシフトされる前又は後に実行される。さらに、このスケーリングは、左又は右画像において全体のオリジナルコンテンツで実行される必要がない。例えば、入力ビデオフレームがディスプレイスクリーンのサイズよりも大きい場合、スケーリングは、スクリーンで目に見えるコンテンツの一部についてのみ実行される。
【0050】
スケーリングモジュール110における使用のため、スケーリングファクタγを決定するため、以下の式で定式化されるカメラモデルが使用される。
【0051】
【数1】
X,Y,Zは、現実のシーンにおける座標であり、(x,y)は、捕捉された画像における座標である。変数α
x,α
y,s,x
0及びy
0は、カメラパラメータである。カメラモデルの更なる詳細は、例えばHartley及びZissermanによる“Multiple View Geometry in Computer Vision”, 2
nd edition, Cambridge University Press, 2004の第6章において発見され、引用により本明細書にその完全な形で盛り込まれる。カメラパラメータα
x,α
yは、下付き文字Vは、左(L)ビュー又は右(R)ビューを表す、先に説明されたシフトパラメータα
Vとは異なる。先の式では、Rは、3×3回転行列であり、Iは、3×3恒等行列であり、Cは、3×1変換行列である。[I|−C]は、3×4行列を形成するため、行列の連結を表す。これらのパラメータが既知であるとき、深度Zにおける変化のためにx及びyの変化を容易に導出することができる。簡単のため、Rが恒等行列であり、C=0及びs=0であるとする。これらの想定について、x−x
0=a
x・x/Zであることが分かる。これは、画像のスケーリングが原点としての主要な点の中心を使用して実行されることを指摘している。従って、Zにおける変化は、シフトパラメータα
Vに従って決定される。
【0052】
図5は、3Dにおいて見られるオブジェクトの深度対視差における変化を示す。画像のシフトは知覚された深度Z
pを代えることが知られている。
図5に示される特定の表示について、画像シフトパラメータαと知覚される深度Z
pとの間に幾何学的な関係がある。この図では、左ビューは、α
L画素だけ左にシフトされ、右のビューは、α
Rだけ右にシフトされる。このシフトの結果として、オブジェクトOの知覚される深度は、Z
pからZ
p’に変化する。知覚される深度Z
pは、知覚される深度がカメラ及びディスプレイの異なる設置のためにZの歪んだバージョンである点で、現実のシーンにおける深度とは異なる。Zは、カメラによる捕捉の前に現実のシーンにおける深度である。従って、スケーリングファクタγを決定するとき、Z
pの変換も考慮されることが好ましい。結果として、スケーリングモジュール112におけるスケーリングファクタγを決定する例示的なプロセスは、以下の通りである、シフトパラメータα
Vに基づくZ
pにおける変化が計算され、Z
pは、捕捉及びディスプレイパラメータの関係に従ってZにマッピングされ、Zがこれらの計算により得られたとき、x及びyにおける変化が計算される。
【0053】
代替的且つおそらく簡単なアプローチでは、広範囲又は正確な計算なしに、予め決定された範囲から、ある値を選択することでスケールファクタγが決定される。例として、シフトパラメータα
V(α
R又はα
L)は、結果として得られる立体コンテンツの潜在的な視聴の不快さを回避するため、0から+60までの範囲で提供され、また、スケーリングパラメータγは、0.8から1.2のような、比較的狭い範囲で提供される。シフト動作がシーンをスクリーンに戻すとき、スケーリングファクタは、1未満となるように選択される。シーンがビューアから離れるほど、スケーリングファクタが小さくなることを理解されたい。シーンがビューアの近くにされるとき、スケーリングファクタは、1よりも大きくなるように選択される。あるシーンが前景に持っていかれると、スケーリングファクタが大きくなる。
【0054】
図3と共に先に記載されたように、シーンのスケーリングは、画像のシフトの前に実行される。1つの例では、スケーリングは、例えば既知のビューアのプロファイル及び好みに基づいて、大部分のビューアに適用可能なシフトパラメータの典型的な範囲に基づいて行われる。別の例では、スケーリングは、ビューアから制御信号を受信した後であって、画像シフト動作の前に行われる。このシナリオでは、スケーリングファクタは、制御信号におけるビューアの入力に少なくとも基づいて計算されたシフトパラメータに基づいて決定される。
【0055】
図6は、本発明の原理に従って実現されたユーザの3D視聴体験を調節するための、
図1におけるシステムの代替的な実施の形態を示す。このコンフィギュレーションでは、3D効果リコメンダ(3DER)モジュール60は、
図1におけるシステムについて示されるエレメントと共に含まれる。
【0056】
ビューアの体験に基づいて深度調節パラメータのビューアの選択は別として、本発明の別の例示的な実施の形態は、3D効果リコメンダモジュール60の使用を想定している。3DER60は、供給された入力3Dビデオのコンテンツを分析する。次いで、前もって取得され、システムに記憶されている、ユーザの視差の快適さプロファイルに基づいて、3DER60は、プロファイルを、供給された3Dビデオコンテンツから分析された視差の特性と比較し、この特定のユーザにとって最良又は最適な調節パラメータを決定する。推薦されるシフト調節パラメータ又は制御パラメータは、ビューアのユーザ装置20に供給される。この推薦されるシフト調節パラメータは、例えば左のビューと右のビューのシフトから得られる全体の視差の変換を表す、α
L及びα
Rの合成である。ビューアは、その時点での好みに基づいて、推薦されるシフト調節パラメータを更に調節することができ、調節された入力(例えば調節された制御パラメータ)は、制御信号を介して3D効果チューナ10に送出される。ビューアは、
図6に示されるように、ユーザ装置20からの制御信号は、3DER60におけるユーザの視差の快適さプロファイルの更新において使用するため、3DER60に供給される。
【0057】
3DER60は、制御シフトパラメータがそのビューアの視覚的な不快さを最小にするために選択されるように、所定のビデオを視聴する所定のユーザの快適さ/不快さのレベルを予測するため、ユーザの視差の快適さプロファイルを使用する。この技術は、ビューアが視聴のために深度のシフトの選択をなうのを支援する。図示されないが、3DER60からの予測されたシフトパラメータは、3D効果チューナ10にダイレクトに供給され、すなわち3DERから予測されたシフト制御パラメータの選択又は調節におけるビューアの関与をバイパスする。
【0058】
図7は、本発明の原理に従って実現された
図6における3D効果リコメンダエレメントの更に詳細なブロック図を示す。
図7に示されるように、3DERは、視差ヒストグラム予測器61、ユーザプロファイルモジュール62、及び不快さ予測モジュール63を含む。予測器61は、立体ビデオ画像を受信し、不快さ予測モジュール63に結合される。ユーザプロファイルモジュール62は、ユーザ装置20からのビューア制御信号を受信する。ユーザプロファイルモジュール62からの出力は、不快さ予測モジュール63に結合される。不快さ予測モジュール63は、ビューアのシフト又は深度の変化の推薦される量を示す推薦される制御パラメータを生成する。3DERの動作は、以下に記載されるように、残りの図面を参照しながら明らかとなるであろう。
【0059】
図8a及び
図8bは、ユーザの快適及び不快レベル対視差のグラフを示す。ユーザの視差の快適さプロファイルは、それぞれのビューアについて画像シフトの主観テストを行うことで構築される。また、3D視聴について一般に許容可能な視聴者の快適さ及び不快さのレベルを確定するために視聴者のテストの代わりに、デフォルト又はベースラインプロファイルが使用される場合もある。
【0060】
例示的なビューアの快適さ/不快さのテストにおいて、選択された3Dコンテンツは、予め定義されたシフト量だけシフトされ、1つ毎にビューアに表示される。次いで、ビューアは、係るコンテンツを見ている間に、ビューア自身の快適さのレベルに従ってシフトされた3Dコンテンツを格付けする機会が与えられる。快適さレベルに関するビューアの反応は、テストされたシフトパラメータのそれぞれについて記録される。ビューアの快適さの格付けは、非常に不快である格付けから非常に快適である格付けまでの範囲に及ぶことが期待される。
【0061】
図8Aは、10画素のステップサイズで−300から200までの視差の値について、ユーザにより格付けされる例示的なスコア又は快適さレベルの例である。 −150から−300までの快適さレベルはゼロのままであるので、これらはこの図から省略される。この例では、ゼロのスコアは、ユーザが左のビューと右のビューとを結合することができないことを意味し、1のスコアは、ユーザが画像について非常に不快であることを意味し、5のスコアは、ユーザが画像について非常に快適であることを意味し、2〜4のスコアは、より小さい程度の不快さ及び快適さを表す。この図から、この特定のビューアは、2D画像である、視差が0であるときに非常に快適であることを感じているように見える。視差が負になるとき、増加される程度のポップアップ効果を示し、ビューアは、視差が−80(快適さレベル0)に到達するまで不快さを感じ始め、この−80の視差で、ビューアはビューを融合することができない。
【0062】
視差dに対応するそれぞれの快適さのスコアは、快適さのスコア(comfort score)を最も高い快適さのスコア(highest comfort score)から減算することで不快さのスコア(discomfort score)に変換される。
【0063】
【数2】
図8Bは、
図8Aに示される快適さスコアのグラフについて対応する不快さのスコアを示す。
図8A及び
図8Bは、ビューアの視差の快適さ及び不快さのプロファイルと呼ばれる。一方のグラフは、他方から導出可能であるので、特にシステムにおけるストレージが制限される場合、一方のグラフのデータのみが記憶されることが考えられる。
【0064】
上述されたビューアの視差の快適さのプロファイルについて、この収集プロセスは、TV又はセットトップボックス(STB)或いは携帯用装置のような他の適切な表示装置に容易に組み込まされる場合がある。これは、ビューアの視差の快適さのプロファイルが、TV又はSTBを通して、ビューアの家でキャリブレーションプロセスを使用して収集されるのを可能にする。このプロセスは、TV内蔵のカラー又はコントラスト調節プロセスに類似する。幾つかの予め定義された3Dテストコンテンツは、TV又はSTBにおいて記憶される。テストのための画像シフトの値は、ユーザにより予め定義されるか又は修正される。ビューアは、シフトされた3Dコンテンツを視聴し、次いでそれらの快適さ/不快さの反応を収集プロセスに与える。反応は、システム内の特定のビューアの視差の快適さのプロファイルに記憶される。
【0065】
はじめに、(例えば
図8Aに示されるものと比較して)大きい視差のステップサイズを有する予め定義された視差の快適さのプロファイルのような粗いユーザプロファイルが使用される。ビューアが3DERにより提供される推薦される深度(シフト)制御パラメータを調節又は修正したとき、3DERは、ビューアの制御装置から最終的に送出される制御信号を受信するため、より洗練されたプロファイルが時間を通して発展される。
【0066】
異なるユーザは、異なるプロファイルを有する。複数の個人が立体ビデオデータを互いに視聴しているとき、それらのプロファイルは、グループファイルに互いに結合され、それら自身の個人のプロファイルと共に記憶及び修正される。
【0067】
不快のスコアを予測するため、はじめに、入力立体ビデオの視差の分布が視差ヒストグラム予測器61で分析される。3Dコンテンツの視差の値は、コンテンツプロバイダにより予め計算され、3Dビデオコンテンツと共にメタデータ又は補助データとして視差のヒストグラムの予測器61に伝達される。また、視差のヒストグラムの予測器61は、伝達されたときに、ビデオコンテンツの視差の値を計算する。一般に、高密度の視差の値が粗な値に対して好まれる。粗い視差の値は、予測器61について高い処理速度が考慮されるときに有効となる。
【0068】
図9は、3Dビデオコンテンツに関連する視差の例示的な(正規化された)ヒストグラムプロットを示す。係るヒストグラムからのデータは、予測器61により生成されるタイプのものである。ヒストグラムプロットの調査により、コンテンツの画素の普通でない部分が大きな視差dを有するかが見られる。この場合、ビューアが、dよりも小さい視差の快適さのプロファイルの制限を有するときに重要な問題となる。それは、これらのビューアは関連するビデオコンテンツを視聴しているときに不快さを感じるからである。
【0069】
例えば、
図8におけるデータによれば、ビューアは、−40を超える視差をもつ領域を使用して、快適さを感じない。結果として、その視差の値が−40前後である
図9におけるビデオコンテンツの15%は、この特定のビューアについて問題を引き起こす。他方で、−10に近い視差を有するビデオコンテンツの37%は、このビューアについて多くの目の緊張又は不快さ生じさせることが期待されない。この分析に従って、その不快さの予測モジュール63を使用した3DER60は、コンテンツの視差が、レベル1を以下の不快レベル(又はレベル4以上の快適さレベル)に対応する[−20,100]内に分布される場合、このビューアは、3Dビデオコンテンツを視聴している間に、非常に心地良さを感じる。
図9で分析されるコンテンツはこの基準に適合しないので、3DER60は、20から100画素だけスクリーン内のビデオ画像のシフトを提供するため、深度のシフトのための推薦される制御パラメータを生成する。
【0070】
3DER60の不快さ予測モジュール63における使用のために視覚的な不快さの予測技術は、例えば個々のビューアの視差の快適さプロファイル及びビューアに提示されるコンテンツの視差の分布を盛り込む。シーンjにあるユーザiの不快さ予測スコアS
ijは、シーンjの正規化された視差の分布D
jの重み付け総和である。重みは、それぞれのビューア
【数3】
ここでd
min及びd
maxは、dの下限及び上限にそれぞれ対応する。1実施の形態では、|d
min|=|d
max|である。しかし、一般に、2つの限界は、大きさにおいて等しい必要はない。ここでF
Diは、0視差で不快スコア値0をもつプロファイルである(
図8B参照)。
【0071】
大部分のシーンについて、小さな視差を示す領域は、コンテンツの高い部分を考慮する。これらの領域は、例えば背景の領域を一般に含む。これらの領域は、視覚的な不快さを通常は引き起こさないので、0に近い重みを割り当てることで、それらの効果において最小化又は軽視することができる。他方で、非常に高い視差の値を有するシーン又は画像の他の領域は知覚可能且つ深刻な視覚的な不快さを引き起こすので、画像コンテンツの非常に小さな部分を考慮して、これらの他の領域は、それらの効果を強調する高い重みが与えられる。
【0072】
1実施の形態では、3DERの出力は、ビューアの不快さスコアS
ijを最小にする、ユーザ装置20又は3D効果チューナ10に供給されるシフト調節パラメータs
ij*である。ここでS
ijは、以下のように定義される。
【0073】
【数4】
言い換えれば、s
ij*は、シーンjでのビューアiの最小の不快さのスコアS
ij(s)を生成するシフト調節パラメータ“s”の値を表す。このパラメータs
ij*は、右のビュー及び左のビュー(α
R及びα
L)のシフトパラメータの合成である。s
ij*は、異なるシフト方向に対応するパラメータα
R及びα
Lについて使用される符号変換に依存して、α
R及びα
Lの総和又は差として表現される。1実施の形態では、α
R及びα
Lは、大きさにおいて等しいが、反対方向におけるシフトを表す。
【0074】
予測器61により実行される分析では、3DERについて、全体のビデオ系列の単一のシーン又は一部の代わりに、ビデオストリームのそれぞれのシーンを分析することができる。また、予測器61による分析は、あるシーンにおける関心のある1以上の特定の領域に適用又は制限される。これは、関心のある領域は、ビューアが集中しているシーンの領域であると理解されるからである。
【0075】
実験練習において、本願発明者は、ビューアのグループに主観テストを行った。テストは、3Dコンテンツに適用される異なる視差の値についてそれぞれのビューアの快適さレベルを得た。テストシーケンスは、Mayaソフトウェアと、黒の背景の前に左から右に飛ぶ唯一のオブジェクトである銃弾からなるコンテンツとを使用して生成される。深度は、一定に維持された。視差の値は、ステップサイズ20で−300から200に及んだ。視差の値のそれぞれについて、ビューアは、0〜5までの快適さのスコアを提供するように依頼され、ここでスコア0は結合することができないことを示し、スコア1は最も不快であることを示し、スコア5は、最も快適であることを示す。この範囲は、ビューアが左画像及び右画像を単一の画像に結合することができないときに条件を含む。この主観テストの結果は、それぞれのビューアのプロファイルの構築を可能にする。このプロファイルは、視差の快適さのプロファイル(DDP: Disparity Discomfort Profile)F
Diと呼ばれる。
【0076】
それぞれのビューアについて得られたDDPによれば、所与のビューアに幾つかのコンテンツが提示されたときに、そのビューアの視覚的な不快レベルを予測する方法が使用された。はじめに、コンテンツは、コンテンツにおけるそれぞれのシーンについて視差のヒストグラムを出力するために分析される。これは、当該技術分野で知られた視差予測方法を使用することで行われる。視覚的な不快さの予測技術は、あるビューアについて取得されたDDP及びコンテンツのあるシーンにおける視差の分布を組み込む。シーンjでのユーザ又はビューアiの不快さの予測スコアS
ijは、シーンjの正規化された視差の分布D
jの重み付けされた総和として計算される。重みは、それぞれのユーザのDDPであるF
Diにより決定される。
【0077】
また、主観テストは、“Beowulf”と題された例示的な3D映画であるHD立体コンテンツの1シーンについて、同じユーザのグループで行われた。ビューアは、0を最も不快であるとして0〜5までの不快スコアを提供するように求められた。結果は、不快予測モジュール63を介して3DERで採用された技法からの予測は、テストされたビューアの多くについて主観テストと非常に良好に整合した。
【0078】
本明細書で示した全ての例及び条件付き言語は、本発明の原理及び当該技術分野を促進するために本発明者により寄与される概念の理解において読者を支援する教育的な目的であることが意図され、係る特に示された例及び条件に限定されないものとして解釈されたい。
【0079】
さらに、本発明の原理、態様及び実施の形態、並びに本発明の特定の例を示す全ての説明は、本発明の構造的に等価な概念及び機能的に等価な概念の両者を包含することが意図される。さらに、係る等価な概念は現在知られている等価な概念と同様に、構造に係らずに同じ機能を実行する開発されたエレメントを含めて、将来において開発された等価な概念を含むことが意図される。
【0080】
多数の実現が本明細書で記載された。他の実現を生成するために、例えば異なる実現のエレメントが結合、補充、変更又は取り除かれる。さらに、当業者であれば、他の構造及び処理は開示されたものについて置き換えられ、結果として得られる実現は、開示される実現と同じ結果を少なくとも実質的に達成するため、少なくとも実質的に同じやり方で、同じ機能を少なくとも実質的に実行する。特に、例示的な実施の形態は、添付図面を参照して記載されたが、本発明の原理はそれら正確な実施の形態に限定されず、様々な変更及び修正は、本発明の範囲又は精神から逸脱することなしに、当業者により実施される場合がある。従って、これらの実現及び他の実現は、本出願により予期され、以下の特許請求の範囲にある。