(58)【調査した分野】(Int.Cl.,DB名)
【背景技術】
【0002】
1947年のステレオスコープの発明以来、視聴者の左眼で見るように意図された第一画像シーケンス、および視聴者の右眼だけで見るように意図された、同一情景の同時の画像であるが第一画像シーケンスに対して視差のある第二シーケンスの画像を再生し、それによって自然三次元視の原理を複製することを通して、視聴者が三次元(3D)プログラムを見ることを可能にする、幾つかのシステムが開発されてきた。1950年代以降、より完全かつ胸躍らせる視聴経験を提供するために、デュアルカメラヘッドシステムを使用して、時間的に同期しかつ視差を持つステレオ対の画像をピックアップして、視聴者が奥行き効果を知覚することを可能にする、多くの映画が製作されてきた。
【0003】
現在、ホームシアターシステムが急速に家庭市場に進出してきており、家庭での高品質映写経験の需要に応じて、非常に高級かつ高品質のシステムが人気を得つつある。それにもかかわらず、既存の立体映像再生システムは視聴者の期待を満たすには依然としてほど遠く、入手可能な最新のホームシアターシステムにさえ依然として組み込まれていない。その理由は主に、比較的低い画像品質(退色および/または階段状の対角線)ならびに通常のフリッキングおよび空間的現実性の欠如によって引き起こされる疲労および不快感にある。実際、テレビ受像機のような単一映像プログラムの提示用に意図された機器で二つの異なるプログラムが提示されるので、二つの映像信号間における技術的資源の分担は、各眼のフレーム提示レートが半分に低下することおよび画像フィールドと黒色背景との間のコントラストのため、画像の空間解像度の損失およびフリッキングを導く。
【0004】
典型的な既存の立体映像再生技術は、インタレース映像信号の偶数ラインフィールドの第一画像シーケンスおよび信号の奇数ラインフィールドの第二画像シーケンスの情報を符号化することから成る。再生時にはシャッタ眼鏡を使用して、偶数ラインの提示中は視聴者の眼の一方を遮蔽し、奇数ラインの提示中は他方の眼を遮蔽する。偶数ラインと奇数ラインを含む通常の画像は一般的に1/60秒の二つの連続走査期間に提示されるので、各眼は1/60秒の画像のシーケンスの後に続く1/60秒のブラックアウト期間として立体映像プログラムを見、各眼が毎秒30フレーム(fps)を見ることが可能になる。さらに、各再生画像は、画像ラインと黒色ラインを交互に入れ替えることによって構成される。明らかに、そのように再生された立体画像はそれらの位相幾何学的情報を損失し、50%のデューティサイクル(空間および時間の両方)は、経験によって確認されている通り、明るさの損失およびフリッキングを誘発する。
【0005】
そのような限界、短所、および欠点の解決策は、少なくとも60fps(各眼に毎秒30フルフレーム)のレートで完全な立体画像を提示することであり、それは通常、非立体(平面)プログラムによって要求される信号帯域幅の少なくとも二倍を必要とする。表示される画像と周囲の照明との間で比較的高いコントラストを提示する部屋でフリッキングを除去するには、各眼に毎秒最高60までのフル精細度画像の提示を可能にするために、最高120Hzまでの垂直走査(およびシャッタ眼鏡)周波数がさらに必要である。そのような周波数は広く利用されてはいないが、立体映像プログラムのフリッカレス提示は、現行製造の二つのデジタルビデオプロジェクタを使用し、各々30fpsの連続レートで立体映像プログラムの第一および第二画像シーケンスをそれぞれ受けることによって、セットアップすることができる。各プロジェクタの出力は光学的にフィルタリングされて、垂直および水平偏波出力投写画像を位置合わせしかつ完全に時間的に同期して特殊銀被覆スクリーン上に生成する。三次元効果を明らかにするために、視聴者は異なる偏光ガラスを備えたアイウェア(eyewear)を着用することができる。そのような解決策は明らかに非常に高価であり、ホームシアターシステムの市場の期待に応えるものではない。
【0006】
しかし、最高120fpsまでの提示レートを提供することができるDLP(デジタルライトプロセシング)技術を使用した非常に高速で比較的安価なプロジェクタが今や利用可能であるので、単一のプロジェクタが高コントラスト環境でもフリッキングを実質的に除去するのに充分な高いレートで立体対シーケンスの画像を交互に提示することができる。また、高級なCRTプロジェクタおよびコンピュータモニタも、そのような互換可能な精細度およびリフレッシュレートを提供することができる。
【0007】
それにも関わらず、映像プログラム情報の格納および放送(伝送)のほとんどの現行規格がフルフレーム画像の流れを、元来二つの24(アメリカンモーションピクチャ)、25(PALまたはSECAM)、または30fps(NTSCビデオ)のプログラムから成る高品質立体映像プログラムを格納および提示するために必要な能力の約半分である30fpsに制限するという、そのようなシステムの主要な限界は変わらない。さらに、映画は常に毎秒24フレームのレートでキャプチャされ記録されるので、二つの24fpsのプログラムを単一の30fpsの信号に圧縮し、その後、そのような信号を伸張して各々30ないし60fpsのレートで二つのプログラムを提示するという二重の問題に対処しなければならない。したがって、3Dホームシアターの将来は、処理中に誘発される情報の損失または歪みが無視できるほど小さくなるように、MAINプロファイル(対MVP)のMPEG−1またはMPEG−2(動画像符号化グループ)圧縮/圧縮解除プロトコルのようなプロトコルを使用して圧縮および圧縮解除される30fpsの信号を処理する、現行製造の標準的レコーダ、プレーヤ、および放送機器に適合するように立体映像信号を符号化および復号化する能力に依存する。
【0008】
先行技術の少数の技術が、上記の短所および限界の一つまたはそれ以上を克服するための解決策を教示している。第一に、3:2プルダウン圧縮法を使用して、24fpsのインタレース画像シーケンスから30fpsの立体映像インタレース信号を生成することができる。この方法では、元のシーケンスの四個の画像毎に一個の新しい画像を
作成して挿入することにより、元の画像シーケンスを時間伸張する。新しい画像は一つのフィールドに先行する画像の偶数ラインを、第二フィールドに次の画像の奇数ラインを含む。明らかに、元のプログラムの各画像は、立体映像プログラムの左視画像の部分を含む第一フィールドと、右視画像の部分を含む第二フィールドとから構成することができる。明らかに、30fpsの立体映像プログラムはそれによって、24fpsの左眼シーケンスおよび24fpsの右眼シーケンスから得ることができる。しかし、そのような技術では、異なる時間にキャプチャされた画像に属するラインが特定の画像で組み合わされるので、結果的に得られる30fpsのプログラムはアナクロニズムおよび位相幾何学的歪みを提示する。これは、現実感が欠如し、眼の疲労および不快感を視聴者にもたらす拙劣な結果を生じる。立体映像プログラムを提示するために使用した場合、この技術はさらに、インタレース信号圧縮技術に関して上記と同じ限界および欠点を免れない。
【0009】
さらに、相互に互換性の無い様々な入力信号を使用し、異なる伝送(格納または配信)フォーマット(列インタリーブ、行インタリーブ、同時デュアルプレゼンテーション、ページフリッピング、アナグリフ等)を必要とする、多くの立体映像表示装置が開発されている。2Dの視聴を可能にしながら、同時に立体映像プログラムを異なるシステムにもたらすための解決策は、全ての既存のフォーマットで幾つかの物理的媒体で同時に放送または格納することであろう。明らかにそれは現実的でもなく、経済的でもない。したがって、家庭における立体映像の将来は、正常な2Dの視聴を可能にしながら現行および将来の立体映像表示装置と互換可能な複数/汎用立体映像出力フォーマットを生成する能力を有する、立体映像信号および映像処理装置を必要とする。
【0010】
多くの特許が、二つの30fpsの信号を30fpsの能力を持つ単一のチャネルで搬送されるように縮小する圧縮技術をも教示しており、それらの幾つかはMPEG圧縮/圧縮解除プロセスに透過的であるように設計されている。しかし、これらの技術は、画像品質を維持しかつ快適な視聴経験を提供しながら、例えば24fpsのシーケンスを30fpsに変換し、あるいは30fpsのシーケンスを48、60、72、96、または120fpsのシーケンスに変換するために紛失フレームを作成するのに必要な時間的補間を特徴とするものではない。さらに、それらは、同一映像信号および映像処理装置から複数の立体映像出力フォーマットを生成する能力を持たない。
【0011】
例えば、1997年5月6日にムラモトら(Muramoto et al.)に付与された米国特許第
5,626,582号(下記特許文献1)は、二つの30fpsの映像信号を所定のクロック周波数でデジタル化してDRAMメモリに格納する時間ベースの圧縮方法を教示している。その後、メモリは、元の期間が1/30の二つのサンプルを1/30の間隔で連結することができるように、書込み周波数の二倍の周波数で読み出される。しかし、選択されたサンプリング周波数によっては、最終信号は、二つの隣接する画素が単一のデジタルデータ(低サンプリング周波数および通常の再生周波数)で平均化されるので精細度を欠如するか、あるいはDVDまたは放送チャネルなどのデータ格納媒体の容量を超えるかのいずれかである。この発明はまた、所定の
原資フォーマットから複数の出力フォーマットを生成する能力も欠如し、元のシーケンスを復元するためには二つの並列回路を必要とする。
【0012】
さらに、1997年11月20日に公開されたブリーデ(Briede)の
国際公開第WO97/43863号(下記特許文献2)では、第一および第二シーケンスの画像から画像が間引きされ、画素は二つの連続する元のラインの相補的画素と単一のラインを形成するように変向され、次いで、左眼および右眼からの新しく形成されたラインとインタレースして、組み合わされた立体画像シーケンスを形成し、チャネルで伝送される。受端では、立体画像シーケンスから並置フィールドが逆多重化され、画素を同時に再配置しかつそれらのそれぞれの立体映像シーケンス(左右)の紛失画素を再形成する二つの平行な伸張回路に送られる。それによって復元された元の第一および第二画像シーケンスが次いで、可視化のために二つのディスプレイに出力される。
【発明を実施するための形態】
【0024】
添付の図において、同様の参照番号は同様の部品を指す。
【0025】
立体映像シーケンスを符号化し、かつ再生するための方法および関連システムの好適な実施形態について、添付の図面を参照しながら詳細に説明する。
【0026】
図1を参照すると、二つの平面画像シーケンスを立体画像シーケンスに圧縮符号化するための本発明に係る典型的なシステムセットアップが示されている。カメラ3および6によって提示される画像シーケンスの第一および第二ソースは、共通またはそれぞれのデジタルデータ格納媒体4および7に格納される。代替的に、画像シーケンスはデジタル化映画フィルムまたはデジタルデータ格納媒体に格納されたデジタル画像ファイルの任意の他のソースから提供することができ、あるいはマイクロプロセッサをベースとするシステムによって読み取るのに適したデジタル映像信号として実時間に入力することができる。カメラ3および6は、それらのそれぞれのキャプチャされた画像シーケンスが情景100の視差を持つ異なる画面を提示し、立体視の概念に従って視聴者の左眼および右眼の知覚をシミュレーションする位置に示されている。したがって、第一および第二のキャプチャされた画像シーケンスを適切に再生すると、視聴者が情景100の三次元視を知覚することが可能になる。
【0027】
ベータカム4:2:2(動画)のような24fpsのデジタルYUVフォーマットで一般的に利用可能な格納されたデジタル画像シーケンスは次いで、5および8のようなプロセッサによって、RGBフォーマットに変換されて、本発明の符号化システムの主要素を表わす動画ミキサユニット1の入力29および30に供給される。しかし、二つの画像シーケンスは代替的に、コストを低減するために、共通プロセッサによって時分割方式で変換することができることに留意すべきである。ミキサ1は二つの平面RGB入力信号を30fpsの立体RGB信号に圧縮し、それは出力31に送り出され、次いでプロセッサ9によって出力32でベータカム4:2:2フォーマットに変換され、次に典型的な回路10によって標準MPEG2ビットストリームフォーマットに圧縮される。結果的に得られるMPEG2符号化立体映像プログラムは次いで、デジタルビデオディスク(DVD)11のような従来の媒体に記録するか、または例えばトランスミッタ13およびアンテナ14を介して単一の標準的チャネル上で放送することができる。代替的プログラム伝送媒体は、例えばケーブル配信網またはインターネットとすることができる。
【0028】
今、
図1bに目を向けると、
図1のシステムを使用して記録または放送された立体映像プログラムの復号化および再生のための本発明に係る典型的なシステムが示されている。第一および第二画像シーケンスからの圧縮情報を含む立体DVD11(3DVD)は、現行製造の従来のプレーヤ15によって再生され、NTSCシリアルアナログ信号を本発明の復号/再生システムの主要素である立体画像復号器2に送り出す。代替的に、アナログまたはデジタルフォーマットのATSC DTV信号を受け入れることができる。
【0029】
復号器2は、第一および第二画像シーケンスを表わすRGB信号の同期化対を出力23および24に生成し、ヘッドマウントディスプレイ(HMD)16のようなデュアル入力立体映像順次表示装置を駆動させる。さらに、復号器2は時間順序付けられた立体RGB信号を出力25に生成し、プロジェクタ17、LCDディスプレイ22、CRTモニタまたはSDTVまたはHDTV21のような単一入力順次表示装置に供給し、それによって第一および第二画像シーケンスからの画像は交互ページフリッピングモードで提示される。代替的に、出力25からの立体RGB信号は、アナログCRTテレビ受像機によって生成されるインタレースNTSC信号または他の立体映像フォーマット(例えば自動立体連ティキュラ表示装置用の列インタリーブ)に変換することができる。また、復号器2は、RGB出力の一つ23または24に立体RGB信号を出力するように内部的に構成し、こうして出力25を除去することができる。
【0030】
復号器2はさらに、眼鏡19を駆動する赤外線シャッタ眼鏡駆動装置20を駆動させるために、出力26に同期タイミング信号を生成する。シャッタ眼鏡19は、視聴者が交互に第一画像シーケンスからの画像を一方の眼で見、第二画像シーケンスからの画像を彼の第二の眼で見ることを可能にすることによって、立体出力25によって供給されるプロジェクタ17によって例えばスクリーン18に投写される三次元プログラムを視聴するために視聴者が着用することができる。
【0031】
上記の説明で述べた通り、二つの元画像シーケンスは含まれる情報が多すぎて、従来のDVDに直接格納したり、あるいは30fpsのレートで情報を処理するMPEG2または同等の多重化プロトコルを使用して従来のチャネルで放送することができない。したがって、ミキサ1は間引きプロセスを実行して、各画像情報を半分に減少する。ミキサ1によって実行される空間間引きについて、今から
図2aおよび2bを参照しながら説明する。
【0032】
図2aは、ミキサ1および復号器2によって処理されるRGB映像信号によって定義される画像50の一部分を示す。見て分かるように、画像50は多数の画素(交互のフルドットおよび空ト゛ット)から構成される。RGBフォーマットでは、各画素はそれぞれ赤、緑、および青の強度を示す三個のデジタル数字のベクトルによって定義される。本発明は、三個の隣接画素が横方向または縦方向のいずれでも急激に異なる強度を持たないという前提を利用する。したがって、本発明は、画像を不当に汚損することなく、画像のサイズを50%低減する圧縮、間引き、または分離プロセスを有利に達成する。
【0033】
図2aは、これがいかに達成されるかを模式的に示す。上記の通り、画像50は多数の画素から構成される。画像の第一画素(1行目の画素1)から始まり、第三画素に続き以下同様に画像全体にわたって、各行の左から右に、かつ上の列から最後の列まで続く画素(中実ドットによって示される)の系列は、モザイクAを形成するために、フレームバッファの半分に配置される。残りの画素、つまり偶数番号の画素(空ドットによって示される)はモザイクBとして配置される。
図2aの例では、画像50の二つの相補的モザイクが、共通の併合画像60のモザイクAおよびモザイクBにそれぞれ格納されるものとして示される。しかし、実際には、この「分離」は、例えば奇数または偶数番号の画素だけを「読み出し」てそれらをフレームバッファに直接配置することができる、適切なハードウェアおよびソフトウェアにより自動的に行なわれることが好ましい。
【0034】
図2bによりよく示す通り、基本的に画像は、50のような第一シーケンス(例えば左眼のシーケンス)の画像のモザイクAおよび50’のような第二シーケンス(例えば右眼のシーケンス)の画像のモザイクBだけを維持することによって、50%空間圧縮することができる。各シーケンスに異なる型のモザイクを維持することにより、第一および第二シーケンスが同一情景の異なる画面を表わす場合に、再生時に高い忠実度が促進される。代替的に、異なる型のモザイクから同じ眼の二つの連続画像が再現され、同一圧縮フレームに潜在的に格納されるように、偶数番号の画像に対してはモザイクAを保存し、奇数番号の画像に対してはモザイクBを保存することによって、空間圧縮を実行することができる。
【0035】
上記の動作は、
図2bに示すように、三画素入力バッファ55に一度に一個ずつ画素データを入力することによって達成される。次いで画素情報は、各々異なる併合画像を作成するのに役立つ一つまたはそれ以上のフレームバッファの適切なメモリ場所に転送される。異なる入力画像からのモザイクは対として並んで連結され、60のような元のサイズの新しい系列の併合フレームの二つの隣接フィールド(左フィールドおよび右フィールド)を形成する。
図2bに示した例では、画像50’は現在処理中であるが、画像50の処理は完了しており、併合画像60の左フィールド(A)に格納された完全なA型のモザイクが生成されている。しかし、圧縮/符号化(ミキシング)方法の好適な実施形態の詳細な説明から明らかになるように、併合フレームは必ずしも第一シーケンスからの画像および第二シーケンスからの画像、あるいは同時にキャプチャされた画像を含むものではないことを指摘しておかなければならない。実際、
図2aの例では、併合画像60のフィールドAおよびフィールドBはそれぞれ、同一画像50からのモザイクAおよびモザイクBで満たされている。その状況は図を単純化するために選択されたものであり、ここで企図する発明の実施形態の一つに係る実際の状況に対応しているが、60のような併合画像は、入力画像のいずれに由来するモザイクでも含むことができると考えられる。サイドバイサイド圧縮伝送フォーマットはほとんどが透過的であり、プロセスの下流のMPEG2メインビュープロトコルを特徴付ける圧縮/圧縮解除処理によって影響されない。
【0036】
併合画像の復号化の後、60のような併合画像のフィールドに位置する圧縮された半サイズ画像(モザイク)から欠落画素を空間補間することによって、完全な画像の復元が実行される。
図2cに示すように、これは、復号器2で復号化された入力併合フレーム60の各画素がメモリへまたはメモリから転送されるときに、実時間で達成することが好ましい。上記の通り、本発明のシステムの基礎にある前提は、隣接画素の値があまり異ならないことである。したがって、モザイクから画像を復元するために、隣接画素は、欠落画素を補間するために加重される。
【0037】
本発明の好適な実施形態では、一度に一個ずつ画素データが三画素入力バッファ65に格納される。図示する通り、入力画像60の陰影付け部分の三個の画素は入力バッファ65に格納されており、同じモザイクからの二個の隣接画素はP
iおよびP
i+1と識別されている。次いで、第三の画素Pjのデータが隣接画素(P
iおよびP
i+1)のRGBベクトルの三つの成分の各々の算術平均として算出される。例えば、画素P
iが(10,0,30
)の強度ベクトルを持ち、画素P
i+1が(20,0,60)の強度ベクトルを持つ場合、
画素P
jは(15,0,45)と算出される。したがって、二つの同一画素の平均は別の
同一画素となる。その算出された(位相幾何学的に補間された)画素は、50のような元の画像シーケンスからのモザイクの作成後に間引かれた欠落画素に取って代わる。
【0038】
元の画素および補間された画素は次いで、フレームバッファの適切なメモリ場所に格納され、そこで対応する画像が復元される(本例では画像72)。併合フレーム60の各行の中心を通って(右フィールドに入る)、データは第二フレームバッファ72’に格納されて、立体画像の右側フィールドに格納されたモザイクから画像を復元する。該プロセスは、二つの画像がそれらのそれぞれのバッファで空間的に復元されるまで、一行ずつ左から右に行なわれる。
【0039】
上記の実施形態はモザイクの二つの隣接画素の平均として一個の画素を補間するが、本発明は三個以上の画素の加重にも備えている。例えば、画素P
jを補間する場合、モザイ
クから二個または三個の先行画素および後続画素を異なる係数と共に使用することができる。さらに詳しくは、
図2cを参照すると、P
jは0.6P
i+1+0.6P
i-1−0.1P
i+2−0.1P
i-2として補間することができる。言うまでもなく、希望する結果に応じて
種々の異なる係数および公式を使用することができる。さらに、水平補間を実行する代わりに、同じプロセスに従って垂直補間を実行することができ、あるいは水平および垂直両方の補間の組合せを実行することができる。
【0040】
フリッカレス表示を確実にするために、当該復号化方法は、以下の説明で詳述する通り、画像シーケンスの時間伸張をさらに含む。フレームバッファが完全に満たされて、完全な復元画像または時間補間画像が得られると(復元プロセスおよびシステムのどの実施形態でも四個を超えるフレームバッファは必要ない)、それらは様々なモードに従って読み出されて、様々な種類の希望する出力信号を提供する。
【0041】
本発明に従ってミキサ1によって実行されるミキシング方法の第一実施形態を添付の図面の
図3aに模式的に示し、以下において詳しく説明する。
【0042】
L1ないしL4と識別されたRGB24fpsフォーマットの第一シーケンス50は最初に、元のシーケンス50の四個の画像毎に新しい画像52を形成して挿入することにより、25%時間伸張されて51のような30fpsの画像シーケンスを形成する。新しい画像52は、直前および直後の画像(元のシーケンス50の#4および#5)の位相幾何学的情報から時間補間される。新しい画像52の各画素は、上記の説明で述べた空間補間技術と同様の仕方で、先行および後続画像の対応する画素の算術平均として算出される。
図2dは、入力画像シーケンス50の二個の時間的に連続する画像50.4および50.5から新しい画像52が形成される時間補間プロセスの特定の例証を提供する。本発明における新しい画像の形成は一般的にそうした技術に従って達成され、例えばフレームの単純な繰返しに比較して再生時の流動性が改善され、処理能力が少なくて済む。代替的に、移動予測に基づく方法など、画像の時間補間を実行するためのいずれかの公知の方法を使用することができる。
【0043】
時間伸張シーケンス51の画像は次いで、
図2bに示しかつ上記の説明で詳述した技術に従って空間圧縮されて、新しいシーケンス53によって表わされるモザイクを形成する。同様に、第二の入力画像シーケンス50’は30fpsシーケンス51’に時間伸張され、シーケンス53’によって表わされるモザイクに空間圧縮される。この特定の実施形態では、それぞれ第一シーケンス53および第二シーケンス53’からの圧縮画像(モザイク)の対が次いで連結されて、30fpsRGBシーケンス60の併合画像の左フィールドおよび右フィールドを形成する。このシーケンス60は、遠隔位置への送信のために、ストリーム62内に符号化することができる。
【0044】
図3aの模式図にもかかわらず、画像シーケンスの処理は並行して長い画像シーケンスで実行されないことが好ましい。実際、時間補間を可能にするために任意の一時にバッファに入れられるのは少数の画像だけであり、代わりに画像は、むしろ
図2bおよび2dに提示したプロセスステップと同様に一画素ずつ、第一および第二(左および右)シーケンスからインポートされ、処理される。
【0045】
今から、
図3b、2cおよび2dを参照することによって、本発明の第一実施形態に従って復号器2によって実行される復号化および復元について説明する。
【0046】
図3bに示す例では、ステレオMPEG信号62がDVDから読み出され、DVDプレーヤ15(
図1b)によって、符号器2により入力されるアナログNTSC信号70に変換される。NTSC信号70は最初にRGBフォーマットに変換されて、シーケンス60にあるような併合画像を回復する。次いで、
図2cに関連して前述したように、シーケンス60の併合画像の左および右フィールドからのモザイクを一画素ずつ空間補間しかつ分離して、72および72’のような30fpsの圧縮解除バッファ画像を形成することによって、第一および第二の元シーケンス50、50’の復元を開始することができる。したがって、空間補間および分離は事実上同時に実行される。RGB画像のシーケンス72および72’はデュアル入力装置に直接出力されて表示され、60fps(各眼に30)の提示レートで元のプログラムまたは立体映像プログラム信号を再生することができる。さらなる処理を実行して、インタレースモード、または順次(ページフリッピングモード)、アナグリフモード、列インタリーブモード、従来の2Dモード等で、多数の既存の単一入力表示装置に画像シーケンスを提示することもできる。
【0047】
しかし、快適で疲労しない視聴を可能にするために、復号器2は、毎秒各眼に36個のフル精細度フレームの一般的レートで出力信号を提供することによって、フリッキングをかなり低減するが、例えばSDTVまたはHDTVのリフレッシュレートに匹敵する高精細度フレームでは、各眼に30fpsで十分な結果を得ることができる。他方、非常に高い忠実度の再生のために、最高120fps(各眼に毎秒60個の画像)までの出力信号を復号器2によって達成することができるが、そのような出力はDLPプロジェクタおよび限られた数の高級装置のような表示装置に匹敵する。経験上、ここで企図されるように符号化/復号化プロセスを通して画像品質が維持されることを前提として、72fpsの再生レートで非常に優れた結果が得られ、そのような周波数は、ホームシアターシステムで現在見かけるほとんどの表示装置の標準である。
【0048】
したがって、復号器2によって実行される再生プロセスは、シーケンス72および72’の提示レートを高めるさらなるステップを含むことが好ましい。
図3aおよび2cに関連してミキシングプロセスの上記説明ですでに述べた時間補間技術を使用して、画像シーケンスに規則的間隔で追加の画像を挿入する。挿入の位置は、ミキシング時に入力シーケンス60の空白行に格納されたフレーム番号情報を通して注意深く制御することができる。代替的に、シーケンス72および72’からの画像を反復して(二回読み出す)、提示時にレートを高めることができる。例えばシーケンスの全ての画像を二回読み出して、提示のレートを倍加することができる。
【0049】
図3bに示した例では、それぞれシーケンス72および72’の画像#2および#3からの情報を使用して、一つの新しい中間画像対73、73’が時間補間され、画像#2と#3の間に挿入され、それによって結果的に得られるシーケンス74および74’のレートが36fps(立体映像プログラムで合計して72fps)に増加する。該プロセスを
図2cに部分的に示す。そこではシーケンス72の画像#2および#3は72.2および72.3と識別される。代替的に、さらなる画像を時間補間して挿入し、例えば合計して96fpsとなるように各シーケンスに毎秒48フレームのレートを提供することができる。各シーケンス(眼)に60fpsのレート(立体映像プログラムでは合計120fps)も、補間を必要としない興味深い事例である。シーケンス72および72’の全ての画像を単に二重化して、画像数を倍加するだけである。再生時に、シャッタ眼鏡は120Hzのレートで駆動され、所定のシーケンスの全ての画像が対応する眼に対して1/30秒に二回提示される。それによって卓越した鮮明さが得られるが、現在は非常に限られた範囲の表示装置しかそのような高いリフレッシュレートを処理できない。
【0050】
上記の説明は、入力シーケンスが映画に一般的な24fpsのレートで供給される事実に基づいていることに注意する必要がある。しかし、
図3aの時間伸張されたシーケンス51および51’によって表わされた時間補間の予備ステップを単に省略することによって、二つの30fpsのシーケンス(例えばTV番組)が供給される事例に、ミキシングプロセスを容易に適応させることができることは、容易に理解することができる。明らかに、復号化プロセスは常に30fpsの入力シーケンスに対して働くので、プロセスのその部分に実質的な適応は必要ない。
【0051】
代替的に、
図4aに示すように、本発明の符号化プロセスは、モザイクを作成する前に時間補間を必要としない。
図4aの例では、フレームを適切に分離することにより、二つの24fpsのシーケンスが混合されて、30fpsのシーケンスが提供される。時間補間画像をシーケンスに挿入することができるので(入力シーケンスが24fpsを含む場合)、圧縮されたシーケンス80は不規則になる。したがって、本発明の本実施形態に係る符号化(ミキシング)プロセスは、画像内容を識別してシーケンスの適切な位置に適切なシーケンス順序(タイミング)でシーケンスを復元するために復元プロセスによって要求されるフレーム番号の識別を可能にするために、圧縮シーケンス60に情報を挿入することをさらに含む。そのような情報は、例えば併合画像の空白行に格納することができる。その手順の有用性は、復号化プロセスについての以下の説明を読むと、いっそう明らかになるであろう。ミキサ1によって実行されるミキシング手順自体はこれで完了する。プロセスではさらに、
図1aに関連して説明した通り、RGB併合画像シーケンス60(例えばAVIファイル)を、MPEG2ビットストリームフォーマットに多重化する前にデジタルYUVフォーマットに変換するか、あるいは
図3で番号62によって識別されるMPEG2フォーマットに直接変換することができる。
【0052】
図4bは、空間および時間補間を使用して、圧縮ステレオシーケンス80をいかに復号化して、二つの36fpsのストリームを提供することができるかを示す。
【0053】
本発明の復号器2のより具体的な表現を
図5に示す。しかし、例えば全部ソフトウェア、全部ハードウェア、または両方を混合した解決策のどれを選択するかによって、変形が可能であることを理解すべきである。
【0054】
見て分かるように、復号器はアナログおよびデジタルの二つの入力を有する。信号がアナログである場合、それはADC101によってデジタル信号に変換される。FIFOバッファ103は入力信号のクロックドメインを復号器によって使用されるクロックドメインに変化させる。実際には、放送信号またはDVD信号は、RGB信号に使用される周波数とは異なる周波数で刻時されるので、FIFOバッファ103が必要である。次いで信号は変換器105に渡され、それは信号をYC
BC
R信号から1×720×480(画素)のRGB信号に変換する。この信号は次いで本発明の教示に従って、空間補間器107によって空間補間され、結果的に720×480画素のデュアルストリームを生じる。このデュアルストリームは次いでスケーラ108によってスケーリングされ、二つの640×480の画像ストリーム(常にRGBフォーマット)が提供される。代替的に、他の解像度を本発明のシステムによってサポートすることができる。次いでフレームは、右フレーム用に一つ、左フレーム用にもう一つのフレームバッファ113に配置され、その内容は入力メモリコントローラ111によって制御される。
【0055】
フレームバッファの出力は出力メモリコントローラ115によって制御され、必要ならば、時間補間されて117、フレームレートを増大する。
【0056】
レートコントローラ119を設けることが好ましい。レートコントローラの目的は、クロック信号の変動に適応することである。該変動は微小であるがシステムを脱同期化させる。レートコントローラはレートの違いを監視し、フレームの不活性行で特定数の画素を追加または除去することによって、出力周波数を修正する。例えば、あるフレームに対し、内部クロックを人工的に遅らせて、クロックを適切に同期化させるために、数画素を付加する必要があるかもしれない。
【0057】
復号器2の別の有利な構成部品は、フリッカ防止フィルタ121である。シャッタ眼鏡を着用した場合、画像とヘッドディスプレイのシャッタの閉状態との間にコントラストがあるときに、フリッキングが発生する。驚くべきことに、各RGB画素の緑色レベルの値を評価することにより、かつ緑色レベルが特定の値を超える場合は対応する画素の色を比例して低減することにより、フリッキングが大幅に低減されることが発見された。
【0058】
次いで出力はそのままデジタルとするか、またはDAC123によってアナログ信号に変換される。同期化モジュール125は、適切な時間にシャッタを開閉するために、ヘッドディスプレイを出力信号と同期化する。
【0059】
さらに調整装置127を設けることがさらに好ましい。この調整装置は、表示装置がそれ自体のフレームバッファを含み、そのためにシャッタの同期信号と実際の表示との間に脱同期化が生じる場合に、有用である。これは、使用者が画像のクロストーク/ゴースト現象を低減するために行なう手動調整である。
【0060】
今から、添付の図面の
図4aを参照しながら、本発明に従ってミキサ1によって実行されるミキシング方法の第二実施形態について詳述する。この第二実施形態は、24fptフォーマットで利用可能な二つの画像シーケンスを変換して、30fpsのMPEG2(メインビュープロファイル)の完全に互換可能なシーケンスを生成する問題に対処するのに特に有利である。
【0061】
モザイクAおよびBを含む二つの24fpsシーケンス50および50’からのフル再精度画像は、(立体映像プログラムの二つのシーケンスを想定して)定義によりそれぞれL
iABおよびR
iABと識別されている。添字「i」は所定の画像の時間tにおける順序番号を表わす。
図4aおよび4bの破線は、フレームのシーケンスを示す。前述した第一実施形態の場合と同様の要領で、八個の入力画像を空間圧縮し、かつ時間伸張して、新しい30fpsのシーケンス80に5個の新しい併合画像を形成する。本発明のこの実施形態では、元の画像情報の25%以上が維持されて記録または放送されることに留意すべきである。実際、第一実施形態での一個に代わって、八個の元画像のうちの二個(示した例では画像L1およびL2)が、圧縮シーケンス80のフィールドに保存されたそれらのモザイクAおよびBの両方を有する。
【0062】
これらの完全に保存された画像はそれにもかかわらず、符号化されたシーケンスの均質性およびMPEG2圧縮/圧縮解除プロトコルとの互換性を確保するために、連続画像間に特定の時間冗長性を提供することにより、並んだ併合画像フィールドに格納された二つの相補的モザイクの形で符号化される。こうして、再生時に、前述した実施形態に比べてより優れた再精度および忠実度が一般的に得られるが、その反面、処理能力要件およびシステムハードウェアのコストが増大する。上記第一実施形態の場合と同様に、発明の本実施形態に係る符号化(ミキシング)プロセスもまた、画像内容を識別し、適切なシーケンス順序でシーケンスを復元し、シーケンスの適切な位置に補間画像を挿入するために復元プロセスで必要になるフレーム番号の識別を可能にするために、圧縮シーケンス80への情報の挿入をさらに含む。再び、そのような情報は例えば併合画像の空白行に格納することができる。
【0063】
本発明に従って復号器2によって実行される対応する復号化プロセスが
図4bに模式的に提示されており、それは次のように働く。
【0064】
30fpsのRGB入力シーケンス80を表わす五個の併合フレーム81〜85を12個の画像(各チャネルに6個)に伸張して、合計36fps(三次元立体映像プログラムの場合、各眼に36、合計72)の再生シーケンス90および100を提供する。破線110によって示されるフレームシーケンスに従ってページフリッピングモードで提示される、12個の連続画像の再生シーケンス90および100の各グループは、全体として、二個の一体的元画像、六個の空間補間画像、および四個の時間補間画像を含む。代替的にシーケンス90および100は、ヘッドマウント装置または自動立体映像装置などの一部の表示装置で要求されるように、二つの別個のチャネルで並行して別個に出力することができる。図示した例では、
1.画像91(L
1AB)は、シーケンス80のフレーム81の左フィールドに格納されたモザイクL
1A、およびその右フィールドに格納されたモザイクL
1Bから完全に復元される。
2.画像101(R
1AX)は、シーケンス80のフレーム82の左フィールドから取り出したモザイクR
1Aから空間補間される。
3.画像103(R
2BX)は、シーケンス80のフレーム82の右フィールドから取り出したモザイクR
2Bから空間補間される。
4.画像102は画像101および画像103から時間補間される。
5.画像93(L
2AB)は、シーケンス80のフレーム83の左フィールドに格納されたモザイク画像L
2A、およびその右フィールドに格納されたモザイクL
2Bから完全に復元される。
6.画像92は画像91(L
1AB)および画像93(L
2AB)から時間補間される。
7.画像94(L
3AX)は、シーケンス80のフレーム84の左フィールドに格納されたモザイクL
3Aから空間補間される。
8.画像96(L
4BX)は、シーケンス80のフレーム84の右フィールドに格納されたモザイクL
4Bから空間補間される。
9.画像95は画像94および画像96から時間補間される。
10.画像104(R
3AX)は、シーケンス80のフレーム85の左フィールドに格納されたモザイクR
3Aから空間補間される。
11.画像106(R
4BX)は、シーケンス80のフレーム85の右フィールドに格納されたモザイクR
4Bから空間補間される。
12.画像105は画像104および画像106から時間補間される。
【0065】
明らかに、そのような復元プロセスには、入力シーケンス80を構成する五個のフレームシーケンスにおけるフレームの順序の適切な識別が必要であることは、容易に理解することができる。したがって、ミキサ1によって併合画像シーケンス80に格納されたフレーム番号情報を解釈するために、フレーム認識回路が復号器2に設けられる。
【0066】
この後者の実施形態では、上記の説明で開示した最初の実施形態と同様に、第一および第二画像シーケンスが、相互に干渉することなく、全く独立に符号化されかつ復号化され、独立した情景を参照する元映像シーケンスの処理が可能であることに気付くことができる。
【0067】
24fpsのソースを処理して72fpsの提示レートをもたらす、第二実施形態の上記の例は、24または30fpsのソースに適用して60、72、96、または120fpsなどの提示レートでステレオ出力を生成することが可能な、より一般的なプロセスの単なる例証である。下記表は、24または30fpsのソースおよび60、72、96または120fpsの提示レートの追加の例示的構成を提供する。
【0069】
上記の通り、上記の処理から得られたRGBシーケンス90および100はデュアル入力装置に直接出力して表示し、元のプログラムまたは立体映像プログラム信号を72fps(各眼に36)の提示レートで復元することができる。しかし、110のような破線矢印によって示すように、時間順序付けられた配列でシーケンス90および100の画像を含む
復号立体映像RGB出力信号(図示せず)を提供するために、さらなる処理が復号器2によって実行される。依然として
図4bの例に関連して、画像は、左眼および右眼画像を次の順序91、101、92、102、93、103、94、104、95、105、96、106で交互に並べることによって、時間順序付けられる。これは、メモリバッファに格納された完全な画像の適切な読出しシーケンスを通して達成される。
【0070】
こうして標準プロジェクタまたは他の表示装置による時間順序付けられた復号信号の提示が可能になり、立体映像プログラムがページフリッピングモードで表示される。復号器2は、表示される立体映像プログラムを三次元モードで、高い忠実度で、フリッキングを無視できるほど小さくして、非常に快適に見るために、視聴者が着用することができるシャッタ眼鏡の駆動装置に必要なタイミング信号を提供する。上記の通り、追加の時間補間画像対を挿入することにより、または特定の画像対を復号化プロセスで反復することにより、提示レートは最高120fpsまで増大することができる。また、本発明では、
RGB復号ステレオ出力信号を、インタレースフォーマットまたは従来の2Dフォーマットのような別の公知の標準的提示フォーマットに変換することができることも企図している。
【0071】
したがって、本発明の上記の実施形態は、二つの動画シーケンスを従来のデータ格納媒体に記録し、従来のビデオディスクプレーヤまたは放送ソースおよび表示装置で再生して、立体映像3D映画を、比類のない性能および快適さでしかも手頃な価格で、広範囲の表示装置の入力信号要件に適合するために多数の出力モードで、家庭で視聴することを可能にする、効果的で現実的な解決策を提供するものであることが容易に理解できる。例えば、上記の説明で定義したように単一の入力信号フォーマットが供給される汎用セットトップボックスに、ページフリッピング、行インタリーブ、列インタリーブ、同時デュアル提示、アナグリフ等のような選択可能なモードを提供することができる。したがって、本発明の符号化/再生方法およびシステムは、先行技術の解決策に勝る多数の利点を持ち、独立した情景を表わす映像シーケンスの処理をはじめ、様々な用途に有利に使用することができる。
【0072】
したがって、本発明が先行技術に勝る利点を提供することは容易に理解されるであろう。周波数フィルタ(低域または帯域通過)を使用せず、圧縮解除を最小限の資源で、実時間で達成することができ、入力および出力の両方で順次またはインタリーブシステムと互換性があり、休止、早送り、まき戻し、低速等が可能であり、現在入手可能な全ての立体映像表示をサポートするので、それはより優れた品質の画像を提供する。
【0073】
本発明をその好適な実施形態によって説明したが、本発明の精神および範囲から逸脱することなく、様々な変形を施すことができる。したがって、記述した実施形態は本発明の単なる例示であり、発明の範囲をそれに限定すべきではなく、請求の範囲の記載およびその均等物によって決定されるべきものである。
【0074】
本発明は、
「第1のフォーマットを有する立体画像ストリームの圧縮された画像ストリームを処理するための方法であって、前記圧縮された画像ストリームは複数のフレームを含み、各フレームは左画像からの画素および右画像からの画素を含む併合画像から成り、
(a)前記圧縮された画像ストリームを圧縮解除するステップと、
(b)各併合画像を受け取るステップと、
(c)復元された左フレームおよび復元された右フレームを形成するために、各併合画像に、少なくとも二つの隣接画素を入力バッファに入れ、中間画素を補間するステップと、
(d)前記左および右画像フレームから立体画像ストリームを復元して、それを出力フレームバッファに格納するステップと、
(e)前記第1のフォーマットとは異なるフォーマットで前記フレームを出力する出力ステップと
を含み、
前記出力ステップは、前記出力において、ページフリッピングモードでの提示用に、毎秒30フレームの前記立体画像ストリームから増加された、少なくとも毎秒36フレームのフレームレートを作るために、前記画像ストリームの表示レートを増加させる工程を含んでいることを特徴とする方法。」(態様1)として構成することができる。
また、本発明は、「態様1に記載の方法であって、前記併合画像を構成する前記左画像からの前記画素は、前記左画像を構成する画素配列から縦横両方向とも一つおきに抽出したものであり、前記併合画像を構成する前記右画像からの前記画素は、前記右画像を構成する画素配列から縦横両方向とも一つおきに抽出したものであることを特徴とすると方法。」(態様2)として構成することができる。
また、本発明は、「態様1または2に記載の方法であって、中間画素を補間する前記ステップが、前記二つの隣接画素を平均することを含むことを特徴とする方法。」(態様3)として構成することができる。
また、本発明は、「態様1から3のいずれか一つに記載の方法であって、中間画素を補間する前記ステップが、前記中間画素を補間するために水平方向の隣接画素を前記中間画素からの距離に応じて加重することを含むことを特徴とする方法。」(態様4)として構成することができる。
また、本発明は、「態様1から4のいずれか一つに記載の方法であって、中間画素を補間する前記ステップが、前記中間画素を補間するために垂直方向の隣接画素を加重することを含むことを特徴とする方法。」(態様5)として構成することができる。
また、本発明は、「態様1から5のいずれか一つに記載の方法であって、前記複数の立体表示モードは、ページフリッピング、行インターリーブ、列インターリーブ、および、アナグリフのうち、少なくとも二つを含むことを特徴とする方法。」(態様6)として構成することができる。
また、本発明は、「態様1から6のいずれか一つに記載の方法であって、前記併合画像は、前記左画像からの画素を含む第1の領域と、前記右画像からの画素を含む第2の領域とを含むことを特徴とする方法。」(態様7)として構成することができる。
また、本発明は、「態様1から7のいずれか一つに記載の方法であって、前記第1のフォーマットとは異なるフォーマットで前記フレームを出力する前記ステップは、前記画像ストリームの表示レートを増加するステップを含むことを特徴とする方法。」(態様8)として構成することができる。
また、本発明は、「態様1から8のいずれか一つに記載の方法であって、前記画像ストリームの表示レートを増加させる前記ステップは、前記復元された立体画像ストリームを時間補間することを含むことを特徴とする方法。」(態様9)として構成することができる。
また、本発明は、
「第1のフォーマットを有する立体画像ストリームの圧縮された画像ストリームを処理するためのシステムであって、
(a)圧縮された画像ストリームを受け取るための入力と、
(b)受け取った前記画像ストリームを圧縮解除するための圧縮解除モジュールと、
(c)各併合フレームを空間補間して復元された右および左フレームを得る動作ができるように前記入力に接続された空間補間モジュールと、
(d)前記復元された右および左フレームを格納するための右および左メモリバッファと、
(e)立体画像表示装置を同期化するための同期化モジュールと、
(f)前記第1のフォーマットとは異なるフォーマットで前記フレームを出力する出力メモリコントローラと
を含み、
前記コントローラは、前記出力において、ページフリッピングモードでの提示用に、毎秒30フレームの前記立体画像ストリームより、少なくとも毎秒36フレーム増加させたフレームレートを作るために、前記画像ストリームの表示レートを増加させることを特徴とするシステム。」(態様10)として構成することができる。
また、本発明は、「態様10に記載のシステムであって、前記出力される立体画像ストリームの周波数を補正するレートコントローラをさらに含むことを特徴とするシステム。」(態様11)として構成することができる。
また、本発明は、「態様11に記載のシステムであって、前記レートコントローラの下流にフリッカ防止フィルタをさらに含むことを特徴とするシステム。」(態様12)として構成することができる。
また、本発明は、「態様10から12のいずれか一つに記載のシステムであって、前記入力の下流にアナログデジタル変換器を含むことを特徴とするシステム。」(態様13)として構成することができる。
また、本発明は、「態様10から13のいずれか一つに記載のシステムであって、前記出力の上流にデジタルアナログ変換器をさらに含むことを特徴とするシステム。」(態様14)として構成することができる。
また、本発明は、「態様10から14のいずれか一つに記載のシステムであって、前記同期化モジュールは、シャッタ眼鏡を同期化させるために用いられることを特徴とするシステム。」(態様15)として構成することができる。
また、本発明は、「態様10から15のいずれか一つに記載のシステムであって、前記複数の立体画像表示モードは、ページフリッピング、行インターリーブ、列インターリーブ、および、アナグリフのうち少なくとも二つを含むことを特徴とするシステム。」(態様16)として構成することができる。
また、本発明は、「態様10から16のいずれか一つに記載のシステムであって、前記コントローラはさらに時間補間器を含み、かつ、前記画像ストリームの表示レートを増加させる前記ステップは、前記復元された立体画像ストリームを時間補間することを含むことを特徴とするシステム。」(態様17)として構成することができる。