特許第6131256号(P6131256)IP Force 特許公報掲載プロジェクト 2022.1.31 β版

知財求人 - 知財ポータルサイト「IP Force」

▶ サムスン エレクトロニクス カンパニー リミテッドの特許一覧

<>
  • 特許6131256-映像処理装置及びその映像処理方法 図000012
  • 特許6131256-映像処理装置及びその映像処理方法 図000013
  • 特許6131256-映像処理装置及びその映像処理方法 図000014
  • 特許6131256-映像処理装置及びその映像処理方法 図000015
  • 特許6131256-映像処理装置及びその映像処理方法 図000016
  • 特許6131256-映像処理装置及びその映像処理方法 図000017
  • 特許6131256-映像処理装置及びその映像処理方法 図000018
  • 特許6131256-映像処理装置及びその映像処理方法 図000019
  • 特許6131256-映像処理装置及びその映像処理方法 図000020
  • 特許6131256-映像処理装置及びその映像処理方法 図000021
< >
(19)【発行国】日本国特許庁(JP)
(12)【公報種別】特許公報(B2)
(11)【特許番号】6131256
(24)【登録日】2017年4月21日
(45)【発行日】2017年5月17日
(54)【発明の名称】映像処理装置及びその映像処理方法
(51)【国際特許分類】
   H04N 13/00 20060101AFI20170508BHJP
【FI】
   H04N13/00 220
   H04N13/00 700
【請求項の数】10
【全頁数】16
(21)【出願番号】特願2014-530592(P2014-530592)
(86)(22)【出願日】2012年9月14日
(65)【公表番号】特表2014-534657(P2014-534657A)
(43)【公表日】2014年12月18日
(86)【国際出願番号】KR2012007362
(87)【国際公開番号】WO2013039347
(87)【国際公開日】20130321
【審査請求日】2015年8月31日
(31)【優先権主張番号】61/534,533
(32)【優先日】2011年9月14日
(33)【優先権主張国】US
(31)【優先権主張番号】10-2012-0091368
(32)【優先日】2012年8月21日
(33)【優先権主張国】KR
(73)【特許権者】
【識別番号】503447036
【氏名又は名称】サムスン エレクトロニクス カンパニー リミテッド
(74)【代理人】
【識別番号】100107766
【弁理士】
【氏名又は名称】伊東 忠重
(74)【代理人】
【識別番号】100070150
【弁理士】
【氏名又は名称】伊東 忠彦
(74)【代理人】
【識別番号】100091214
【弁理士】
【氏名又は名称】大貫 進介
(72)【発明者】
【氏名】リモノフ,アレクサンダー
(72)【発明者】
【氏名】リ,ジン−ソン
(72)【発明者】
【氏名】ミン,ジョン−スル
【審査官】 益戸 宏
(56)【参考文献】
【文献】 特開2007−028439(JP,A)
【文献】 特開2003−209858(JP,A)
【文献】 特開2002−247611(JP,A)
【文献】 特許第5127973(JP,B2)
(58)【調査した分野】(Int.Cl.,DB名)
H04N 13/00−15/00
G06T 19/00
(57)【特許請求の範囲】
【請求項1】
D映像に含まれたテキスト領域を検出するテキスト領域検出部と、
前記検出されたテキスト領域に対応するテキストマスクを生成するマスク生成部と、
記生成されたテキストマスクに基づいて前記テキスト領域のデプスを第1デプス値に補正するデプス補正部と
を含み、
前記第1デプス値は、
【数9】
によって算出され、L(x、y)は左眼イメージ、R(x、y)は右眼イメージであり、Tはテキスト領域であり、dはデプス値である、ことを特徴とする映像処理装置。
【請求項2】
前記デプス補正部は、
前記デプスの補正されたテキスト領域にデプステンポラルスムージング(depth temporal smoothing)処理を行うことを特徴とする請求項1に記載の映像処理装置。
【請求項3】
前記テキスト領域検出部は、
テキストライン及びテキストカラーを検出し、検出されたテキストライン及びテキストカラーに基づいてテキスト領域を検出することを特徴とする請求項1に記載の映像処理装置。
【請求項4】
前記マスク生成部は、
前記検出されたテキストラインによってマスクを拡張し、前記検出されたテキストカラーによって前記拡張されたマスクをフィルタリングして前記テキストマスクを生成することを特徴とする請求項に記載の映像処理装置。
【請求項5】
前記3D映像のデプスを推定し、前記推定されたデプスに基づいてデプスマップ(depth map)を生成するデプス推定部を更に含み、
前記デプス補正部は、
前記デプスマップで前記テキスト領域に対応するデプス値を補正することを特徴とする請求項1に記載の映像処理装置。
【請求項6】
入力された3D映像に含まれたテキスト領域を検出するステップと、
前記検出されたテキスト領域に対応するテキストマスクを生成するステップと、
記生成されたテキストマスクに基づいて前記テキスト領域のデプスを第1デプス値に補正するステップと
を含み、
前記第1デプス値は、
【数10】
によって算出され、L(x、y)は左眼イメージ、R(x、y)は右眼イメージであり、Tはテキスト領域であり、dはデプス値である、ことを特徴とする映像処理方法。
【請求項7】
前記デプスの補正されたテキスト領域にデプステンポラルスムージング(depth temporal smoothing)処理を行うステップを更に含むことを特徴とする請求項に記載の映像処理方法。
【請求項8】
前記テキスト領域を検出するステップは、
テキストライン及びテキストカラーを検出し、検出されたテキストライン及びテキストカラーに基づいてテキスト領域を検出することを特徴とする請求項に記載の映像処理方法。
【請求項9】
前記テキストマスクを生成するステップは、
前記検出されたテキストラインによってマスクを拡張し、前記検出されたテキストカラーによって前記拡張されたマスクをフィルタリングして前記テキストマスクを生成することを特徴とする請求項に記載の映像処理方法。
【請求項10】
前記3D映像のデプスを推定し、前記推定されたデプスに基づいてデプスマップ(depth map)を生成するステップを更に含み、
前記デプスを補正するステップは、
前記デプスマップで前記テキスト領域に対応するデプス値を補正することを特徴とする請求項に記載の映像処理方法。
【発明の詳細な説明】
【技術分野】
【0001】
本発明は、映像処理装置及びその映像処理方法に関し、より詳細には、3D映像を提供する映像処理装置及びその映像処理方法に関する。
【背景技術】
【0002】
最近、より臨場感のある視聴のために、3Dディスプレイ装置に対する開発への取り組みが加速化している。それにより、従来は映画館で主に視聴していた3D映像を家庭でもテレビのような一般のディスプレイ装置を用いて視聴することができるようになった。
【0003】
一方、3D映像で映画タイトル、ゲームスコアのようにオーバーレイ(overlaid)テキストは、ユーザに関心を提供する部分である。しかし、既存のステレオマッチングアルゴリズム(stereo matching algorithms)によってオーバーレイテキストに対する正確なディスパリティを算出することは困難である。
【0004】
それによる空間的なディスパリティ不一致は、テキスト歪み及びフリッカーの原因となる。このような問題点は、テキスト領域でより目立つようになる。それにより、テキスト領域におけるディスパリティ不一致を解消するための方策が求められる。
【発明の概要】
【発明が解決しようとする課題】
【0005】
そこで、本発明は、上記問題に鑑みてなされたものであり、本発明の目的とするところは、3D映像に含まれたテキスト領域のデプスを補正することができる映像処理装置及びその映像処理方法を提供することにある。
【課題を解決するための手段】
【0006】
以上のような目的を達成するための本発明の一実施形態に係る映像処理装置は、入力された3D映像のデプスを推定するデプス推定部と、前記3D映像に含まれたテキスト領域を検出するテキスト領域検出部と、前記検出されたテキスト領域に対応するテキストマスクを生成するマスク生成部と、前記推定されたデプス及び前記生成されたテキストマスクに基づいて前記テキスト領域のデプスを補正するデプス補正部とを含む。
【0007】
なお、前記デプス補正部は、前記推定されたデプスに基づいて前記テキスト領域のデプスを第1デプス値に補正してよい。
【0008】
ここで、前記第1デプス値は、下記数式によって算出されてよい。
【0009】
【数1】
ここで、L(x、y)は左眼イメージ、R(x、y)は右眼イメージであり、dはテキストである。
【0010】
なお、前記デプス補正部は、前記デプスの補正されたテキスト領域にデプステンポラルスムージング(depth temporal smoothing)処理を行ってよい。
【0011】
なお、前記テキスト領域検出部は、テキストライン及びテキストカラーを検出し、検出されたテキストライン及びテキストカラーに基づいてテキスト領域を検出してよい。
【0012】
なお、前記マスク生成部は、前記検出されたテキストラインによってマスクを拡張し、前記検出されたテキストカラーによって前記拡張されたマスクをフィルタリングして前記テキストマスクを生成してよい。
【0013】
なお、前記デプス推定部は、前記推定されたデプスに基づいてデプスマップ(depth map)を生成し、前記デプス補正部は、前記デプスマップで前記テキスト領域に対応するデプス値を補正してよい。
【0014】
一方、本発明の一実施形態に係る映像処理方法は、入力された3D映像のデプスを推定するステップと、前記3D映像に含まれたテキスト領域を検出するステップと、前記検出されたテキスト領域に対応するテキストマスクを生成するステップと、前記推定されたデプス及び前記生成されたテキストマスクに基づいて前記テキスト領域のデプスを補正するステップとを含む。
【0015】
なお、前記デプスを補正するステップは、前記推定されたデプスに基づいて前記テキスト領域のデプスを第1デプス値に補正してよい。
【0016】
ここで、前記第1デプス値は、下記数式によって算出されてよい。
【0017】
【数2】
ここで、L(x、y)は左眼イメージ、R(x、y)は右眼イメージであり、dはテキストである。
【0018】
なお、前記デプスの補正されたテキスト領域にデプステンポラルスムージング(depth temporal smoothing)処理を行うステップを更に含んでよい。
【0019】
なお、前記テキスト領域を検出するステップは、テキストライン及びテキストカラーを検出し、検出されたテキストライン及びテキストカラーに基づいてテキスト領域を検出してよい。
【0020】
なお、前記テキストマスクを生成するステップは、前記検出されたテキストラインによってマスクを拡張し、前記検出されたテキストカラーによって前記拡張されたマスクをフィルタリングして前記テキストマスクを生成してよい。
【0021】
なお、前記デプスを推定するステップは、前記推定されたデプスに基づいてデプスマップ(depth map)を生成し、前記デプスを補正するステップは、前記デプスマップで前記テキスト領域に対応するデプス値を補正してよい。
【発明の効果】
【0022】
以上説明したように、本発明によれば、3D映像を視聴する視聴者の便宜性を向上させることができる。
【図面の簡単な説明】
【0023】
図1】本発明が適用されるテキスト領域のエラー状態について説明するための図である。
図2】本発明の理解を促すための両眼に写る物体に対するディスパリティについて説明するための図である。
図3】本発明の一実施形態に係る映像処理装置の構成を示すブロック図である。
図4】本発明の一実施形態に係るデプス補正部の細部構成を示すブロック図である。
図5】本発明の一実施形態によってテキストマスクを生成する方法について説明するための図である。
図6】本発明の一実施形態によってテキストマスクを生成する方法について説明するための図である。
図7】本発明の一実施形態に係るアルゴリズムについて説明するためのブロック図である。
図8】本発明の一実施形態に係る映像処理方法について説明するためのフローチャートである。
図9】本発明が適用されるテキスト領域のエラー状態について説明するための図である。
【発明を実施するための形態】
【0024】
以下に添付図面を参照しながら、本発明の好適な実施形態について詳細に説明する。
【0025】
図1及び図9は、本発明が適用されるテキスト領域のエラー状態について説明するための図である。
【0026】
最近、多くの電子装置は、ステレオビデオ再生機能を提供する。このような装置のサイズは小型モバイルフォンで大型テレビパネルまで、多様である。2D映像と違って、3Dステレオコンテンツは不適切なディスパリティが目の緊張及び疲れをもたらすおそれがあるため、スクリーンサイズに適するように容易にスケーリングすることができない。よって、全ての3Dステレオコンテンツは、視聴者の不都合を防止するために、既存のディスプレイサイズ及び視聴距離を採択する必要がある。
【0027】
一般に、ディスパリティはステレオスコピックワーピング(warping)によって調整されてよい。この場合、デプスマップは、左眼及び右眼イメージの間の対応部分を検出することで推定される。同一の接近方式が、オートステレオスコピックディスプレイに対するビュー補間に適用され、全ての中間ビューは既存の最左側、最右側ビュー及び対応するデプスマップから同期化されてよい。
【0028】
一方、周期的なパターン及び薄い前景オブジェクトを有するイメージは、ステレオマッチングアルゴリズムに対して共通したエラーソースになる。ディスパリティ推定エラーは、ステレオスコピックワーピング後に深刻な視覚的な欠陥を引き起こすおそれがある。
【0029】
オブジェクトの歪み及びフリッカーは、特に、人の顔、テキスト及びロゴ等のような高い突出性(saliency)領域で目立つ。
【0030】
特に、オーバーレイテキストは、背景イメージと互いに異なるデプスを有する周期的なパターン及び文字のストローク近くに位置するため、ステレオマッチングに対するステレオスコピックイメージのうち、最も難しい部分の1つである。
【0031】
一般的に、テキスト領域に対する不正確及び/または不一致のデプス推定は、歪み及びフリッカーを引き起こす。このような欠陥は、ユーザに眩暈を引き起こしたり、集中を妨げたり、とある時にはテキストが読み取れなくなるときもある。
【0032】
図1は、3D映像のテキスト領域で発生するフリッカー現象を示す図である。
【0033】
図9は、3D映像のテキスト領域で発生する歪み現象を示す図である。
【0034】
それにより、本発明では、3D映像のテキスト領域で発生するフリッカー及び歪み現象を軽減させる方策が提案される。
【0035】
図2は、本発明の理解を促すための両眼に写る物体に対するディスパリティについて説明するための図である。
【0036】
図2において、Vは3Dディスプレイと視聴者との間の距離を示し、Dはオブジェクトがスクリーンから仮想で飛び出たり窪んで見える距離を示し、Eは視聴者間の両眼距離を示す。このとき、両眼に写る物体に対するディスパリティは下記の数式(1)のように表現されてよい。
【0037】
【数3】
前記数式(1)によると、仮想3D映像からD分だけスクリーンに窪んで映すために、ディスパリティだけの両眼に映る時点のシフトが要求される。このような特性に応じて、3Dディスプレイはディスパリティだけ離れた仮想の右眼映像と仮想の左眼映像とを生成してユーザに立体感を感じさせるようにする。
【0038】
図3は、本発明の一実施形態に係る映像処理装置の構成を示すブロック図である。
【0039】
図3に示すように、映像処理装置100は、受信部110と、デプス推定部120と、テキスト領域検出部130及びデプス補正部140を含む。
【0040】
受信部110は、3D映像信号を受信する。
【0041】
ここで、3D映像は、ステレオ映像であってよい。ステレオ映像とは、1つの被写体を別の角度から撮影した2つの映像、すなわち、左眼映像及び右眼映像を含む。このようなステレオ映像は、多様なソースから提供されてよい。一例として、受信部110は、放送局チャネルのようなソースからステレオ映像を有線または無線で受信することができる。この場合、受信部110は、チューナ部、復調部、等化部のような多様な構成要素を備えることができる。
【0042】
または、受信部110は、DVD、ブルーレイディスク、メモリカード等のような各種記録媒体を再生できる記録媒体再生ユニットから再生されたステレオ映像を受信することもでき、カメラから撮影されたステレオ映像を直接受信することもできる。この場合、受信部110は、USBインターフェース等のような各種インターフェースを具備する形態で実現されてよい。
【0043】
または、受信部110は、ウェブサーバのような外部サーバからステレオ映像を受信することも可能である。
【0044】
または、3D映像は、2D/3D切り替え技法に応じて、2D映像を基板として生成された映像であってよい。それについての詳細な説明は、省略する。
【0045】
デプス推定部120は、左眼映像及び右眼映像に基づいて、映像内に存在する客体に関するデプス情報を推定する。ここで、デプス(depth)情報とは、映像内に存在する客体の3次元距離情報を示すものとして、デプスマップまたはデプス映像と称してよい。
【0046】
例えば、被写体とカメラとの間の距離、被写体と被写体の映像とが結像する記録媒体間の距離等のように、立体感の情報を示す情報を意味する。すなわち、左眼映像と右眼映像との間の互いに対応するポイント間の距離差が大きい場合、その分だけより立体感が増大するようになる。デプスマップとは、このような深さの変化状態を1つの映像で構成したものとして、左眼及び右眼映像で互いにマッチングするポイント間の距離の大きさに応じて異なるグレイレベルで表現されてよい。例えば、デプスマップで明るく表示された部分は立体感の大きい部分であり、暗く表示された部分は立体感の小さい部分を意味する。
【0047】
具体的に、デプス推定部120は、映像を構成する各ピクセルごとに、0から255の間の値でデプス値を表現し、映像内に存在する客体の3次元距離情報を示してよい。例えば、黒/白を基準に表すとき、黒(低い値)が視聴者から遠いところを表し、白(高い値)が視聴者から近いところを表してよい。
【0048】
一方、デプス推定部120は、デプスマップを生成するために、左眼及び右眼映像で互いにマッチングするポインタを探すステレオマッチング作業を行うことができる。この場合、適応的な加重値を適用してステレオマッチングを行うこともできる。
【0049】
例えば、左眼映像と右眼映像とは、1つの被写体を互いに異なる時点で撮影した映像であるため、視覚の差による映像の差が生じるおそれがある。例えば、左眼映像では被写体のエッジ部分と背景とが重なって写り、右眼映像ではやや離れた場合等である。よって、被写体を基準に一定範囲内のピクセル値を有するピクセルに対しては加重値をアップし、範囲から外れたピクセル値を有するピクセルに対しては加重値をダウンした適応的な加重値を適用することができる。それにより、左眼映像及び右眼映像のそれぞれに対して適応的な加重値を適用した後に、その結果を比較し、マッチング可否を決定することができる。このように、適応的な加重値を用いると、正しい適応点であるにもかかわらず、低い相関関係を有すると判定されることを防止することができるようになるため、マッチングの精度が向上される。
【0050】
一方、図示はしていないが、映像処理装置100には、デプスマップ生成のための演算の負担を軽減するためのダウンスケーラ部(図示せず)が更に含まれてよい。すなわち、ダウンスケーラ部(図示せず)は、受信部110を介して受信された映像をダウンスケーリングしてデプス推定部120に提供することで、演算負担を軽減させることができるようになる。
【0051】
テキスト領域検出部130は、3D映像に含まれたテキスト領域を検出する。ここで、テキスト領域は、字幕領域、OSDに含まれたテキスト領域、放送会社Logo領域等、オーバーレイテキスト領域であってよい。
【0052】
テキスト領域検出部130は、既に検出されたテキストフレームに対してテキストローカライゼーション(localization)を行うことができる。ここで、テキストフレームは、入力される映像の中で、固定された間隔で配置された部分または圧縮されたドメイン部分を検出することで検出されてよい。
【0053】
テキスト領域検出部130は、検出されたテキストフレームに対してエッジ抽出等の前処理を行い、前処理されたフレームのハフ変換(Hough Transform)等の線形抽出過程を通じて線形部分を抽出することで、テキストが含まれた領域を抽出することができる。
【0054】
具体的に、テキスト領域検出部130は、テキストライン及びテキストカラーを検出し、検出されたテキストライン及びテキストカラーに基づいてテキスト領域を検出することができる。ここで、テキスト領域は、四角状で抽出されてよいが、それに限定されるものではない。
【0055】
テキスト領域の検出のために、テキスト領域検出部130は、例えば、テキスト領域の検出するために、テキストライン集合接近方法を利用してよい。ここで、ラインは、Wu et al.(V. Wu、R. Manmatha、and E. M. Riseman、“Textfinder: An automatic System to detect and recognize text in images、” IEEE Trans. Pattern Anal. Mach. Intell.、vol. 21、no. 11、pp. 1224−1229、Nov. 1999.)に開示された方法と類似する固定された垂直エッジの密度に応じて検出されてよい。
【0056】
1.垂直エッジ検出
垂直エッジを検出するために、以下の数式(2)のようにイメージ1の垂直成分Gyを算出する。
【0057】
【数4】
そして、現在のフレームnに対するエッジ閾値ETを以下の数式(3)のように設定する。
【0058】
【数5】
ここで、kは臨界時間スムージングに利用される以前のフレームの数を示す。
【0059】
安定的なエッジ検出のために、確率モデルを利用する。エッジ確率Ep(x、y)は、以下の数式(4)のようにアップデートされる。
【0060】
【数6】
エッジ確率が0.5より大きい場合のピクセルが現在のフレームに対してエッジピクセルとしてカウンティングされる。
【0061】
2.テキストライン検出
各水平ラインに対してエッジ密度EDを算出する。関数ED(y)は中間フィルタを用いて処理される。
【0062】
テキストラインに対して、垂直エッジに関連して同一の確率モデルを利用する。
【0063】
ライン閾値は、ED(y)のRMSとして定義される。ライン確率Lpが0.5より大きい連続的なイメージラインはテキストラインを形成するのに組み合わせられ、最後にテキストラインは最小及び最大のラインの高さに応じてフィルタリングされる。
【0064】
3.テキストカラー検出
テキストカラーを検出するために入力されたイメージカラー量子化を適用し、RGBカラー空間を256カラーのパレット(Pallete)に変換する、各カラーc及びテキストライン内側CD in(c)に、テキストラインの外側CD out(c)の等しい領域でカラー密度を算出する。ここで、cはカラーテキストのカラーであってよい。
【0065】
一方、本発明の別の実施形態によると、テキスト領域に含まれたテキストを抽出し、テキストに対してデプスを補正することも可能である。この場合、テキストは、テキスト領域に対してモーフォロジーオペレーションまたは区域基盤処理等を通じて行われてよい。
【0066】
デプス補正部140は、推定されたデプス及び生成されたテキストマスクに基づいてテキスト領域のデプスを補正する。
【0067】
具体的に、デプス補正部140は、推定されたデプス及び生成されたテキストマスクに基づいてテキスト領域のデプスを均一の第1デプス値に補正することができる。すなわち、テキスト領域内に含まれたそれぞれのテキストに対するデプス感が相互異なることがないように表現されるように、均一のデプス値を付与することができる。
【0068】
この場合、デプス補正部140は、デプス推定部120で推定されたテキスト領域のデプス値のうち、最も大きい値にテキスト領域のデプスを均一に設定することができる。
【0069】
なお、デプス補正部140は、場合によって、周辺領域のデプス値を考慮することもできる。すなわち、テキスト領域が周辺の背景映像と異質にならず、不連続に表現されないように、周辺の背景映像のデプス値と類似する値にデプスを設定することができる。すなわち、推定されたテキスト領域のデプス値のうち、背景映像のデプス値と最も類似する値にテキスト領域のデプスを設定することも可能である。
【0070】
なお、デプス補正部140は、デプスの補正されたテキスト領域に対してフリッカを軽減させるために、デプステンポラルスムージング(depth temporal smoothing)処理を行うことができる。
【0071】
デプス補正部140については、図4を参照して詳細に説明する。
【0072】
一方、図示はしていないが、映像処理装置100は映像処理部(図示せず)、3D映像生成部(図示せず)及びディスプレイ部(図示せず)を更に含んでよい。
【0073】
映像処理部(図示せず)は、テキスト領域のデプスの補正されたデプスマップに基づいて、補正された左眼映像と右眼映像とをそれぞれクロップ(crop)した後、互いに重畳して3D映像を生成することができる。
【0074】
3D映像生成部(図示せず)は、左眼映像及び右眼映像を互いに対応する大きさにクロップして3D映像を生成する。ここで、3D映像とは、クロップされた左眼映像及び右眼映像が重畳して生成した1つの3D映像ファイルを意味してよく、クロップされた左眼映像及び右眼映像のそれぞれが保存されたファイルを意味してよい。
【0075】
ディスプレイ部(図示せず)は、3D映像生成部(図示せず)から出力されるデータを用いて3D映像をディスプレイする。すなわち、3D映像生成部(図示せず)でクロップされた左眼及び右眼映像を重畳して1つの3D映像を生成した場合には、その3D映像を直ちにディスプレイすることができる。または、クロップされた左眼映像及び右眼映像を別途に出力する場合、出力された2つの映像を重畳して3D映像形態で出力することができる。
【0076】
一例として、ディスプレイ部(図示せず)は、3D映像を空間的に区分して出力し、メガネかけなくても、被写体との距離感を感じられるようになり、3D映像として認識することができる。この場合、ディスプレイ部(図示せず)は、パララックスベアラ(Parallax Barrier)技術またはレンチキュラー(Lenticular)技術によるディスプレイパネルで実現されてよい。または、ディスプレイ部(図示せず)は、左眼及び右眼映像を交互に出力し、立体感を感じられるように実現することもできる。すなわち、本映像処理装置は、非メガネシステム及びメガネシステムのいずれでも実現可能である。
【0077】
一方、上述の実施形態では、左眼映像及び右眼映像に基づいてテキスト領域のデプスを補正するものとして説明したが、それは一実施形態に過ぎない。本発明の別の実施形態によると、2D映像に対してテキスト領域を検出した後、テキスト領域に対するデプス値を均一に割り当てた後、左眼及び右眼映像を生成することも可能である。
【0078】
図4は、本発明の一実施形態に係るデプス補正部の細部構成を示すブロック図である。
【0079】
図4に示すように、デプス補正部140は、マスク生成部141及びテキスト領域デプス補正部142を含む。
【0080】
マスク生成部141は、テキスト領域検出部130から検出されたテキストラインによってマスクを拡張し、検出されたテキストカラーによって拡張されたマスクをフィルタリングしてテキスト領域に対応するマスクを生成することができる。
【0081】
図5は、本発明の一実施形態によってテキストマスクを生成する方法について説明するための図である。
【0082】
図5の(a)に示すように、オーバーレイテキストを有する入力映像に、図5の(b)に示すように、オーバーレイテキストを含むテキスト領域に対応するテキストマスクを生成してテキスト領域に対するデプスを補正することができる。
【0083】
テキストマスクは、次のような繰り返しプロセスによって生成される。
【0084】
1.垂直エッジマスク拡張
2.テキストカラーによるマスクフィルタリング
ここで、繰り返しプロセスは、テキストラインの内側のテキストマスクが安定すると終了する。安定した結果のために、上述のようにテキストマスクに対する同一の確率モデルを適用することができる。
【0085】
テキスト領域デプス補正部142は、マスク生成部141で生成されたマスクを用いてテキスト領域のデプスを均一の値に設定することができる。
【0086】
テキスト領域デプス補正部142は、上述のように、テキスト領域に対して算出されたデプス値のうち、最大値にテキスト領域のデプスを均一に設定することもできるが、場合によっては、以下のように多様な方式でデプスを設定することも可能である。
【0087】
例えば、0を含むデフォルト値、背景映像に含まれた客体のうち、最も高いデプス値または平均値より所定の値だけ大きいデプス値、テキスト領域の中央におけるデプス値または境界におけるデプス値、ユーザによって入力された値等をテキスト領域のデプス値に設定することもできる。
【0088】
なお、1つのフレーム内にテキスト領域が複数個である場合には、複数のテキスト領域のそれぞれに異なるデプス値を設定したり、同一のデプス値を設定することができる。
【0089】
具体的に、全イメージ領域が同一のデプス値を有するとしたら、SAD(sum of absolute difference method)の最小値を検索して探すことができる。この場合、全テキスト領域に対するステレオマッチングは、ウィンドウベースマッチングより改善された結果を提供することができる。
【0090】
左眼イメージL(x、y)及び右眼イメージR(x、y)及び対応するバイナリテキストマスクT(x、y)が与えられると、テキストdに対するデプス値を補正し、次の数式(5)のように最小化するようになる。
【0091】
【数7】
補正デプス値dが各テキスト領域に対して検出されると、全てのテキストピクセルに対して予め設定されたデプス値をオーバーレイすることができる(図6の(a))。結果的に、デプスマップは図6の(b)のように示される。
【0092】
テキストマスクが理想的であり、全てのテキストピクセルが同一のデプスを有する場合、最小SAD値は小さく、0に近くならなければならない。言い換えると、最小SAD値が相対的に大きい場合、テキストマスクは不適切だったり、テキストが互いに異なるデプス値を有してよい。両方の場合に、デプス補正は更なるエラーを引き起こすおそれがあるため望ましくない。このようなテキストは、デプス補正が安全であることを保障することができる。
【0093】
スムージング処理部143は、デプス値の補正されたテキスト領域に対してデプステンポラルスムージング(depth temporal smoothing)処理を行うことができる。
【0094】
スムージング処理部143は、デプス値の補正されたテキスト領域の内部で一定ではないデプス値をスムージング処理し、デプス変動によるテキストフリッカを除去したり、補正されたデプス値と背景領域のデプス値との差によるテキスト領域の境界で歪みを解消するために、スムージング処理を行うことができる。
【0095】
スムージング処理部143は、デプス値の補正されたテキスト領域に対して、メディアンフィルタ(median Filter)、加重平均フィルタ(weighted average Filter)、マキシマムフィルタ(maximum filter)等のようなスムージングフィルタを適用し、スムージング処理を行うことができる。
【0096】
以下の数式(6)は、スムージング処理の一例を示す。
【0097】
【数8】
ここで、ω∈(0、1)である。
【0098】
図7は、本発明の一実施形態に係るアルゴリズムについて説明するためのブロック図である。
【0099】
図7に示すように、まず、左眼及び右眼映像が入力されると、ステレオデプスを推定してデプスマップを生成する。
【0100】
なお、入力された左眼及び右眼映像でオーバーレイテキスト領域を検出する。
【0101】
次に、検出されたオーバーレイテキスト領域に対応するテキストマスクを生成する。
【0102】
次に、推定されたデプス及び生成されたテキストマスクに基づいてテキスト領域のデプスを補正してデプスマップを補正する。
【0103】
このように補正されたデプスマップは、3D映像のデプス調整のような多様な機能に利用されてよい。
【0104】
図8は、本発明の一実施形態に係る映像処理方法について説明するためのフローチャートである。
【0105】
図8に示す映像処理方法によると、まず、入力された3D映像のデプスを推定する(S810)。
【0106】
更に、3D映像に含まれたテキスト領域を検出する(S820)。
【0107】
なお、検出されたテキスト領域に対応するテキストマスクを生成する(S830)。
【0108】
続いて、推定されたデプス及び生成されたテキストマスクに基づいてテキスト領域のデプスを補正する(S840)。
【0109】
一方、テキスト領域のデプスを補正するステップS840では、ステップS810で推定されたデプスに基づいてテキスト領域のデプスを第1デプス値に補正することができる。
【0110】
この場合、第1デプス値は、上述の数式(6)によって算出されてよい
なお、第1デプスが補正されたテキスト領域にデプステンポラルスムージング(depth temporal smoothing)処理を行うことができる。
【0111】
なお、テキスト領域を検出するステップS820では、テキストライン及びテキストカラーを検出し、検出されたテキストライン及びテキストカラーに基づいてテキスト領域を検出してよい。
【0112】
なお、テキストマスクを生成するステップS830では、検出されたテキストラインによってマスクを拡張し、検出されたテキストカラーによって拡張されたマスクをフィルタリングしてテキストマスクを生成することができる。
【0113】
なお、デプスを推定するステップS810では、推定されたデプスに基づいてデプスマップ(Depth map)を生成することができる。この場合、デプスを補正するステップS840では、生成されたデプスマップでテキスト領域に対応するデプス値を補正することができる。
【0114】
それにより、3D映像のテキスト領域に発生する歪み及びフリッカを軽減することができるようになる。
【0115】
一方、本発明は、2D映像及びデプス情報に基づいてマルチビュー映像を生成する場合にも同様に適用されてよい。
【0116】
上述の多様の実施形態に係るディスプレイ装置の制御方法や、メガネ装置の制御方法は、ソフトウェアで生成されて映像処理装置に搭載されてよい。
【0117】
具体的には、本発明の一実施形態に係る映像処理装置には、入力された3D映像のデプスを推定するステップと、3D映像に含まれたテキスト領域を検出するステップと、検出されたテキスト領域に対応するテキストマスクを生成するステップと、推定されたデプス及び生成されたテキストマスクに基づいてテキスト領域のデプスを補正するステップとを行うプログラムが保存された非一時的な読み取り可能な媒体が設置されてよい。
【0118】
非一時的な読み取り可能な媒体とは、レジスタやキャッシュ、メモリ等のように短い間だけデータを保存する媒体ではなく、半永久的にデータを保存し、機器によって読み取り(Reading)が可能な媒体を意味する。具体的には、上述の多様なアプリケーションまたはプログラムは、CDやDVD、ハードディスク、ブルーレイディスク、USB、メモリカード、ROM等のような非一時的な読み取り可能な媒体に保存されて提供されてよい。
【0119】
以上、添付図面を参照しながら本発明の好適な実施形態について詳細に説明したが、本発明は以上の実施形態に限定されない。本発明の属する技術の分野における通常の知識を有する者であれば、特許請求の範囲に記載された技術的趣旨の範疇内において、各種の変更例または修正例に想到し得ることは明らかであり、これらについても、当然に本発明の技術的範囲に属するものと了解される。
図1
図2
図3
図4
図5
図6a)】
図6b)】
図7
図8
図9