(58)【調査した分野】(Int.Cl.,DB名)
前記視差生成部は、前記一定期間内に取得された前記複数の立体画像のうち最も手前の画像より所定距離手前の位置を前記ユーザインターフェース画像の表示位置とする視差をユーザインターフェース視差として生成する
請求項1記載の画像処理装置。
前記ユーザインターフェース視差に応じた位置を表示位置とする前記ユーザインターフェース画像を前記複数の立体画像の各々に合成する画像合成部をさらに具備する請求項1記載の画像処理装置。
【発明を実施するための形態】
【0016】
以下、本技術を実施するための形態(以下、実施の形態と称する)について説明する。説明は以下の順序により行う。
1.第1の実施の形態(最も手前にUI画像を立体表示させる例)
2.第2の実施の形態(UI画像の表示位置をさらに手前に補正する例)
3.第3の実施の形態(UI画像の表示位置の変化を滑らかにする例)
【0017】
<1.第1の実施の形態>
[情報処理システムの構成例]
図1は、第1の実施の形態における情報処理システムの一例を示す全体図である。この情報処理システムは、受信装置100、画像処理装置200、および、表示装置300および遠隔制御装置400を備える。
【0018】
受信装置100は、動画ストリームおよび字幕ストリームを受信するものである。この動画ストリームは、所定の放送規格に準拠して放送局などから配信された動画のデータである。放送規格としては、例えば、DVB(Digital Video Broadcast)が使用される。この動画は、時系列に沿って表示される複数の画像を含む。また、この動画は、立体表示させるために作成された動画であり、動画内の画像の各々を以下、「立体主画像」と称する。立体主画像の各々は、視聴者の左目に映すための左側主画像と、右目に映すための右側主画像とを含む。
【0019】
また、動画は、所定の符号化方式に従って必要に応じて符号化されている。符号化方式としては、例えば、MPEG(Moving Picture Expert Group)2−TS(Transport Stream)規格が用いられる。MPEG2−TSにおいて、符号化された画像は、PES(Packetized Elementary Stream)パケットに格納され、それぞれの画像にはPTS(Presentation Time Stamp)および視差が対応付けられる。PTSは、再生出力の時刻管理情報であり、そのタイムスタンプが付与された画像をいつ再生出力するかを示す。視差は、主画像を立体表示させるためのものである。具体的には、字幕データから左側主画像および右側主画像の水平方向におけるずれが視差に該当する。以下、動画の視差を「動画視差」と称する。
【0020】
なお、受信装置100は、アナログ放送を受信し、その放送波をA/D(Analog to Digital)変換することにより動画ストリームを生成してもよい。
【0021】
受信装置100が受信する字幕ストリームは、放送局などから配信された字幕に関するデータである。具体的には、字幕ストリームは、字幕データと、その字幕データに対応付けられた視差およびPTSを含む。字幕データは、例えば、字幕を表わす画像(以下「字幕画像」と称する。)や字幕を表わす文字列を含む。字幕ストリームにおける視差は、字幕を立体表示させるためのものである。具体的には、字幕データから左側字幕画像および右側字幕画像が生成された場合において、それらの画像の水平方向におけるずれが視差に該当する。この左側字幕画像および右側字幕画像からなる画像を以下、「立体字幕画像」と称する。また、字幕の視差を以下、「字幕視差」と称する。字幕データおよび字幕視差も必要に応じて符号化されてPESパケットに格納される。字幕ストリームにおけるPTSは字幕をいつ再生出力するかを示す時刻管理情報であり、動画と同期して字幕を再生するために用いられる。
【0022】
字幕ストリームは、動画ストリームに多重化されて配信される。受信装置100は、動画ストリームから字幕ストリームを分離し、分離後の動画ストリームおよび字幕ストリームを画像処理装置200に供給する。なお、受信装置100の代わりに、画像処理装置200が字幕ストリームを分離してもよい。
【0023】
画像処理装置200は、動画ストリームおよび字幕ストリームに基づいて、動画に字幕画像やユーザインターフェース(以下、「UI」と称する。)画像を合成するものである。UI画像は、ユーザが、所定の機器(例えば、表示装置300)との間で情報をやりとりするための画像である。この画像処理装置200は、字幕ストリームから、字幕視差および字幕データを取得し、その字幕視差に応じた位置に立体表示される立体字幕画像を字幕データから生成する。また、画像処理装置200は、遠隔制御装置400の制御に従って、UI画像およびUI視差を生成する。UI視差は、UI画像を立体表示させるためのものである。画像処理装置200は、UI視差に応じた位置に立体表示される立体UI画像をUI画像から生成する。画像処理装置200は、それらの立体UI画像および立体字幕画像を動画に合成する。そして、画像処理装置200は、立体字幕画像および立体UI画像が合成された動画を表示装置300に供給する。
【0024】
なお、画像処理装置200は、放送局などから配信された動画ストリームおよび字幕ストリームを受信装置100から取得する構成としているが、動画記録装置などに記録された動画ストリームおよび字幕ストリームを画像処理装置200が取得してもよい。
【0025】
表示装置300は、立体字幕画像や立体UI画像が合成された動画を立体表示するものである。立体表示の方式としては、アクティブシャッターグラス方式、偏光表示方式や、視差バリア方式などが用いられる。なお、表示装置300は、特許請求の範囲に記載の表示部の一例である。
【0026】
遠隔制御装置400は、表示装置300などの機器を制御するための操作信号をユーザの操作に従って生成するものである。遠隔制御装置400は、その操作信号を画像処理装置200に赤外線などを利用して送信する。
【0027】
なお、情報処理システムは、動画および字幕の両方を立体表示させる構成としているが、動画のみを立体表示させる構成としてもよい。その場合、字幕の視差が配信されない。もしくは、左側画像および右側画像のずれがないことを示す値(例えば、「0」)の視差が字幕視差として配信される。
【0028】
[画像処理装置の構成例]
図2は、第1の実施の形態における画像処理装置200の一構成例を示すブロック図である。この画像処理装置200は、視差取得部210、復号部220、視差バッファ230、同期制御部240、UI視差生成部250、UI画像生成部260、立体UI画像生成部270および立体字幕画像生成部280を含む。また、画像処理装置200は、立体字幕画像合成部285および立体UI画像合成部290を含む。
【0029】
視差取得部210は、動画ストリームおよび字幕ストリームから視差およびPTSを取得するものである。具体的には、視差取得部210は、動画ストリームおよび字幕ストリームのそれぞれにおけるPESパケットのヘッダからPTSを取得し、そのPESパケットのペイロードから視差(動画視差および字幕視差)を取得する。
【0030】
手前側から奥側までの範囲の視差が、例えば256段階で区分される場合、視差として「−128」乃至「127」の値が取得される。取得された視差は、右側画像を基準として左側画像および右側画像を水平方向にずらす量として用いられる。視差が負数(「−128」乃至「−1」)である場合には、奥行き方向において、画像(主画像または字幕画像)が基準位置より手前側に立体表示される。一方、視差が正数(「1」乃至「127」)である場合には、画像が基準位置より奥側に立体表示される。視差が「0」である場合には、画像は基準位置に表示されるが、立体的には視認されない。なお、視差は、左側画像を基準として左側画像および右側画像を水平方向にずらす量であってもよい。この場合には、視差が負数である場合に画像が基準位置より奥側に立体表示され、正数である場合に画像が基準位置より手前側に立体表示される。また、視差の範囲は、256段階以外の段階で区分してもよい。例えば、手前側および奥側をいずれも127段階に区分し、基準位置と合わせて手前側から奥側までを255段階に区分してもよい。
【0031】
視差取得部210は、同じPESパケットから取得したPTSおよび視差を対応付けて視差バッファ230に保持させる。視差バッファ230は、PTSに対応付けて視差を保持するものである。
【0032】
復号部220は、動画ストリームが符号化されている場合に、その動画ストリームを復号するものである。この復号部220は、動画ストリームの符号化方式と対応する復号方式に従って、動画ストリームを復号する。復号部220は、復号した動画ストリームを立体字幕画像合成部285に供給する。また、復号部220は、字幕ストリームからPTSを取得して、同期制御部240に供給する。
【0033】
同期制御部240は、動画の表示タイミングに同期して字幕データおよび視差を立体字幕画像生成部280に供給するものである。具体的には、同期制御部240は、復号部220が取得したPTSを受け取り、そのPTSに一致する値のPTSが視差バッファ230に保持されているか否かを判断する。保持されていれば、同期制御部240は、そのPTSと対応する字幕視差を視差バッファ230から読み出す。同期制御部240は、読み出した字幕視差と、その字幕視差に対応する字幕データとを立体字幕画像生成部280に供給する。
【0034】
UI視差生成部250は、一定期間内に取得された動画視差および字幕視差に対応する画像のいずれよりも手前の位置をUI画像の表示位置とする視差をUI視差として生成するものである。具体的には、UI視差生成部250は、一定期間内に取得された動画視差および字幕視差のうち最大の視差に所定の補正量α(αは正の実数)を加算する。UI視差生成部250は、加算後の値をUI視差として立体UI画像生成部270に信号線259を介して供給する。なお、UI視差生成部250は、特許請求の範囲に記載の視差生成部の一例である。
【0035】
UI画像生成部260は、UI画像を生成するものである。例えば、ネットワークの設定、録画設定、画面の輝度値やガンマ値の補正、番組表の表示などを行うための画像がUI画像として生成される。具体的には、番組表などを表示する場合には、UI画像生成部260は動画ストリームから番組表を取得しておき、操作信号に従って、その番組表を示す画像を生成する。UI画像生成部260は、生成したUI画像を立体UI画像生成部270に供給する。
【0036】
立体UI画像生成部270は、UI視差に応じた表示位置に立体表示するための立体UI画像を生成するものである。立体UI画像生成部270は、画面内においてUI画像をUI視差に応じて、視聴者から見て左方向にずらした画像と、右方向にずらした画像とを生成し、これらの一方を左側UI画像とし、他方を右側UI画像とする。立体UI画像生成部270は、生成した右側UI画像および左側UI画像からなる立体UI画像を立体UI画像合成部290に供給する。
【0037】
立体字幕画像生成部280は、字幕視差に応じた表示位置に立体表示するための立体字幕画像を生成するものである。立体字幕画像生成部280は、画面内において字幕画像を字幕視差に応じて、視聴者から見て左方向にずらした画像と、右方向にずらした画像とを生成し、これらの一方を左側字幕画像とし、他方を右側字幕画像とする。ただし、文字列を含む字幕データから立体字幕画像を生成する場合には、立体字幕画像生成部280は、その文字列が描画された画像を字幕画像として生成し、その字幕画像を左右にシフトさせて右側字幕画像および左側字幕画像を生成する。立体字幕画像生成部280は、生成した右側字幕画像および左側字幕画像からなる立体字幕画像を立体字幕画像合成部285に供給する。
【0038】
立体字幕画像合成部285は、立体字幕画像を動画に合成するものである。立体字幕画像合成部285は、立体字幕画像を合成した動画ストリームを立体UI画像合成部290に供給する。
【0039】
立体UI画像合成部290は、立体UI画像を動画に合成するものである。立体UI画像合成部290は、立体字幕画像が合成された動画ストリームに立体UI画像をさらに合成して表示装置300に供給する。
【0040】
[UI視差生成部の構成例]
図3は、第1の実施の形態におけるUI視差生成部250の一構成例を示すブロック図である。このUI視差生成部250は、統計周期計時部251、最大視差更新部252、最大視差記憶部253、および、UI視差算出部255を備える。
【0041】
統計周期計時部251は、一定の周期(以下、「統計周期」と称する。)内における時刻を計時するものである。統計周期計時部251は、例えば、初期値(「0」など)から最大値(「100」など)までの範囲の値を所定の時間(例えば、1ミリ秒)が経過するたびに繰り返し計数するカウンタを備え、そのカウンタ値をタイマ値として最大視差更新部252に出力する。
【0042】
最大視差更新部252は、統計周期内に取得された動画視差および字幕視差の中の最大視差を求めるものである。具体的には、最大視差更新部252は、タイマ値が初期値であるときに、最大視差記憶部253に「0」の値の視差を最大視差として記憶させる。最大視差更新部252は、タイマ値が最大値になるまでの統計周期内において、視差バッファ230を参照し、視差が取得されるたびに、その視差と最大視差記憶部253における最大視差とを比較する。最大視差更新部252は、取得された視差の方が大きければ、その視差により最大視差記憶部253を更新する。そして、タイマ値が最大値であるときに、最大視差更新部252は、最大視差記憶部253から、その時点における最大視差を読み出してUI視差算出部255に供給する。最大視差更新部252は、統計周期の各々において、これらの処理を繰り返し実行する。
【0043】
UI視差算出部255は、最大視差が供給されるたびに、その最大視差より大きな視差をUI視差として生成するものである。具体的には、UI視差算出部255は、最大視差が供給されると、その最大視差に所定の補正量αを加算し、その値をUI視差とする。UI視差算出部255は、生成したUI視差を立体UI画像合成部270に供給する。ただし、最初の統計周期においては最大視差が求められないため、UI視差算出部255は、例えば、所定の設定値(「127」など)をUI視差として用いる。あるいは、UI視差算出部255は、前回の動画ストリームにおいて最後に設定したUI視差を記憶しておき、そのUI視差を、今回の動画ストリームにおける最初の統計周期において出力する。
【0044】
なお、UI視差算出部255は、最大視差に補正量αを加算することによりUI視差を生成しているが、最大視差より大きな視差を生成することができるのであれば、他の方法でUI視差を生成してもよい。例えば、UI視差算出部255は、最大視差に「1」より大きな所定の補正量を乗算し、その値をUI視差としてもよい。
【0045】
図4は、第1の実施の形態における動画ストリームの一構成例を示す図である。動画ストリームは、GOP(Group Of Pictures)と呼ばれる単位で符号化されており、このGOP単位で復号部220において復号される。このGOPは、符号化において基準となるI(Intra)ピクチャを少なくとも1枚含む画像の集合である。同図におけるaでは、1枚のIピクチャと、4枚のP(Predirective)ピクチャと、10枚のB(Bidirectionally predictive)ピクチャとの計15枚の画像611によりGOP610を構成する様子が示されている。ここで、Iピクチャは、符号化において基準とされる画像である。Pピクチャは、時間的に先行するIピクチャまたはPピクチャとの差分を利用して符号化される画像である。Bピクチャは、時間的に前後両方向のIピクチャまたはPピクチャとの差分を利用して符号化される画像である。
【0046】
GOP内の15枚の画像は、
図4におけるbに例示するように一部の順序が入れ替えられて符号化される。これは、MPEG規格における符号化方式の特徴に基づくものであり、復号の際に時間的に後続の画像を待つことを回避するためである。例えば、Bピクチャ(B5)を復号化するためにはIピクチャ(I3)とPピクチャ(P6)を参照する必要がある。このため、Bピクチャ(B5)を復号する時点で必要な画像データ(I3およびP6)が揃うように、同図におけるbのような入れ替えをしなければならない。なお、このような画像521の順序関係を定義するために、V_PCKのパックヘッダにおいてPTS622およびDTS(Decoding Time Stamp)623というタイムスタンプが付与される。PTS622は前述したように、再生出力の時刻管理情報であり、そのタイムスタンプが付与された単位画像をいつ再生出力するかを示す。一方、DTS623は復号の時刻管理情報であり、そのタイムスタンプが付与された単位画像をいつ復号するかを示す。
【0047】
符号化された各画像は、
図4におけるcに例示するように、それぞれ1つ以上のパックに収められる。パックとは、複数のPESパケットを連結してパックヘッダを付加したものである。例えば、Iピクチャ(I3)はV_PCK_I3(530)として保持され、Bピクチャ(B1)はV_PCK_B1(531)として保持される。そして、1個のGOP610を構成するV_PCK530の集合においては、補助的なデータを含むARI_PCK520がA_PCK520とともに多重化される。多重化されたパック群は、動画ストリームを構成する。
【0048】
図5は、実施の形態における字幕ストリームの一構成例を示す図である。字幕ストリームは、動画ストリームとは独立したPESパケット群から構成される。このPESパケットは、字幕ストリームを構成するデータ(字幕データや視差など)を必要に応じて分割し、ヘッダを付加してパケット化したものである。字幕ストリームにおける各々のPESパケットは、パケットヘッダおよびペイロードを含む。パケットヘッダには、PTSなどが記載される。ペイロードには、PTSの示すタイミングで表示される字幕データや、その字幕データの視差が格納される。また、ペイロードには、字幕データが表示される領域の水平座標や垂直座標、字幕データが合成される主画像の構成(水平座標および垂直座標の範囲など)が格納される。
【0049】
図6は、実施の形態における字幕ストリーム内のPESパケットのデータ構成の一例を示す図である。このPESパケットにおいては、例えば、DVB(Digital Video Broadcasting)規格に従ってデータが記述される。DVB規格において、PESパケットのヘッダには、字幕ストリームの識別情報(Stream_id)、PESパケット長(PES_packet_length)、および、字幕データのPTSなどが記載される。また、字幕データがPESパケット内に配置されることを示すインジケータ(PES_alignment_indicator)が記載される。「PES_packet_data_byte」のフィールドには、PESパケットのペイロード(「PES_data_field」内のデータ)が格納される。このペイロードには、「subtitle_segment()」のフィールドが設けられる。DVB規格においては、字幕ストリームの構成要素のデータのそれぞれは「segment」と呼ばれる。それぞれの「segment」の詳細は、
図6における「subtitle_segment()」のフィールドにおいて記述される。具体的には、「subtitle_segment()」には、「segment」の開始位置を特定するための情報(sync_byte)が記載される。また、このフィールドには、「segment」の種類(segment_type)、その長さ(segment_length)、および、「segment」が用いられる主画像の識別情報(page_id)が記載される。また、「segment」のデータ自体は「segment_data_field」に格納される。「segment」の種類(segment_type)は、例えば、字幕データ、字幕視差、字幕データの構成情報(表示される領域の水平座標や垂直座標など)、字幕データが合成される主画像の構成(水平座標および垂直座標の範囲など)である。
【0050】
図7は、実施の形態におけるPESパケットに格納されるデータの一例を示す図である。前述したように、PESパケットのペイロード内の「subtitle_segment()」には、「segment_type」や「segment_data_field()」と呼ばれる領域が設けられる。「segment_data_field()」には、字幕データや字幕視差が格納される。
図7におけるaは「segment_data_field()」に「segment」として字幕データが格納される場合の一例を示す。この場合には、「segment_type」のフィールドにおいて「segment」が字幕データであることを示す「0x13」が記載される。また、
図7におけるbは、「segment_data_field()」に「segment」として視差が格納される場合の一例を示す。この場合には、「segment_type」のフィールドにおいて、「segment」が字幕視差であることを示す「0x15」が記載される。
【0051】
図8は、視差バッファ230の一構成例を示す図である。視差バッファ230には、PTSに対応付けて視差が保持される。具体的には、PTSが付与されたPESパケットから取得された視差(動画視差または字幕視差)が、そのPTSに対応付けて視差バッファ230に保持される。PTSが共通の動画視差および字幕視差は、そのPTSに対応付けて保持される。例えば、「PTS#1」に対応付けて「10」の字幕視差が保持される場合、「PTS#1」のタイミングにおいて、「10」の字幕視差が読み出される。そして、字幕視差「10」に応じた位置に、字幕画像が立体表示される。
【0052】
[画像処理装置の動作例]
図9は、実施の形態における画像処理装置200の動作の一例を示す図である。この動作は、例えば、画像処理装置200に動画ストリームおよび字幕ストリームが入力されたときに開始する。
【0053】
画像処理装置200における視差取得部210は、動画ストリームおよび字幕ストリームからPTSおよび視差(動画視差および字幕視差)を取得して視差バッファ230に保持させる(ステップS901)。UI視差生成部250は、取得された視差に基づいて最大視差を更新する(ステップS902)。立体字幕画像生成部280は、字幕データおよび字幕視差から立体副画像を生成する。また、立体UI画像生成部270は、UI画像およびUI視差から立体UI画像を生成する(ステップS903)。立体字幕画像合成部285は、動画ストリームに立体字幕画像を合成し、立体UI画像合成部290は、その動画ストリームに立体UI画像を合成する(ステップS904)。
【0054】
UI視差生成部250は、統計周期が経過したか否かを判断する(ステップS905)。統計周期が経過したのであれば(ステップS905:Yes)、UI視差生成部250は、その時点における最大視差を、経過した統計周期内における最大視差として決定する(ステップS906)。そして、UI視差生成部250は、その最大視差+補正量αをUI視差として生成する(ステップS907)。また、UI画像生成部260は、操作信号に従ってUI画像を生成する(ステップS908)。統計周期が経過していない場合(ステップS905:No)、または、ステップS908の後、画像処理装置200は、ステップS901に戻る。
【0055】
図10は、実施の形態における視差を説明するための図である。表示装置300の表示面に表示される右側画像の基準の水平座標(例えば、中央の水平座標)をX
Rとし、左側画像の基準の水平座標をX
Lとする。水平座標は、視聴者から見て左側であるほど、値が小さいものとする。この場合において、例えば、X
RからX
Lを減じた値が視差Dとして用いられる。
【0056】
ここで、左目と右目との間の距離をベース距離Bとし、視聴者から表示装置300までの距離をfとし、奥行き方向に立体的に視認される立体画像の表示位置をZpとする。このとき、右目、左目および立体画像の中心のなす三角形と、X
R、X
Lおよび立体画像の中心のなす三角形とは相似であるため、次の式1が成立する。
D:f=B:Zp 式1
式1により、Zpに表示させるための視差(動画視差および字幕視差)Dが求められて、動画ストリームおよび字幕ストリームにより配信される。
【0057】
図11は、実施の形態における立体表示の方法の一例を示す図である。同図におけるaは、画像(主画像または字幕画像)を手前側に表示するための表示方法の一例を示す図である。水平方向において、右側画像701の座標は視聴者から見て左側であり、左側画像702の座標が視聴者から見て右側であるものとする。この場合において、視聴者の左目に左側画像702が映り、右目に右側画像701が映るように、表示装置300がこれらの画像を表示すると、視聴者は、画像801が手前側に表示されているように視認することができる。
【0058】
図11におけるbは、基準位置に画像を表示する表示方法の一例を示す図である。右側字像701および左側画像702の水平座標は変わらないものとする。この場合において、視聴者の左目に左側画像702が映り、右目に右側画像701が映るように、表示装置300がこれらの画像を表示すると、表示装置300の表示面(基準位置)に画像801が表示されているように視認される。このときは、画像801は、立体的に視認されない。
【0059】
図11におけるcは、画像を奥側に表示するための表示方法の一例を示す図である。水平方向において、右側画像701の座標は視聴者から見て右側であり、左側画像702の座標が視聴者から見て左側であるものとする。この場合において、視聴者の左目に左側画像702が映り、右目に右側画像701が映るように、表示装置300がこれらの画像を表示すると、視聴者は、画像801が奥側に表示されているように、立体的に視認することができる。
【0060】
図12は、第1の実施の形態におけるUI視差の変化の一例を示す図である。
図12における横軸は時間であり、縦軸は、その時間軸上の時刻の視差である。実線は、UI視差301の変動を示す。白丸は、UI視差が更新される時刻の各々における更新後のUI視差を示す。1点鎖線および2点鎖線の軌跡は、字幕視差302および303の変動を示す。また、点線の軌跡は、動画視差304の変動を示す。
【0061】
統計周期が経過するたびに、その統計周期内に取得された動画視差304と字幕視差302および303とのうちの最大視差に補正量αを加えた値が、次の統計周期におけるUI視差として設定される。例えば、時刻t
0からt
1までの統計周期内の最大視差がM
1であれば、M
1+αが、時刻t
1からt
2までの次の統計周期内のUI視差として設定される。これにより、UI画像の視差が最も大きくなり、UI画像が最も手前に表示される。
【0062】
図13は、第1の実施の形態における最も手前に立体表示させたUI画像の一例を示す図である。統計周期内の動画視差および字幕視差のうち最大視差より大きな視差がUI視差として設定される。例えば、ある統計周期内の最大視差が左側字幕画像703および右側字幕画像704の視差であった場合、その視差より大きな視差が、次の統計周期における左側UI画像705および右側UI画像706の視差として設定される。これにより、左側UI画像705および右側UI画像706によるUI画像803の表示位置は、左側字幕画像703および右側字幕画像704の視差に応じた字幕画像802の表示位置より手前に立体表示される。
【0063】
このように本技術の第1の実施の形態によれば、画像処理装置200は、統計周期内に取得された動画視差のいずれよりも大きな視差をUI視差とすることにより、次の統計周期においてUI画像を最も手前に立体表示させることができる。これにより、ユーザがUI画像を視認しやすくなり、そのUI画像による機器の操作性が向上する。
【0064】
<2.第2の実施の形態>
[画像処理装置の構成例]
図14は、第2の実施の形態における画像処理装置200の一構成例を示すブロック図である。第1の実施の形態において、ある統計周期内のUI視差は、前の統計周期内の最大視差から生成されていた。しかし、最大視差を求めた統計周期の次の統計周期内に動画視差や字幕視差が急激に変動した場合に、その最大視差から生成したUI視差より大きな視差が設定されてしまうおそれがあった。第2の実施の形態の画像処理装置200は、生成したUI視差を超えないように動画視差および字幕視差を補正する点において第1の実施の形態と異なる。具体的には、第2の実施の形態の画像処理装置200は、視差補正部215をさらに備える点において第1の実施の形態と異なる。
【0065】
第2の実施の形態のUI視差生成部250は、生成したUI視差を立体UI画像生成部270のほか、視差補正部215にさらに供給する。
【0066】
視差補正部215は、動画視差および字幕視差をUI視差未満に補正するものである。具体的には、視差補正部215は、視差(動画視差および字幕視差)が取得されるたびに、それらの視差とUI視差とを比較する。取得された視差がUI視差以上であれば、視差補正部215は、そのUI視差未満(例えば、UI視差−1の値)に視差を補正する。視差補正部215は、補正後の視差およびPTSを視差バッファ230に保持させる。
【0067】
図15は、第2の実施の形態におけるUI視差の変化の一例を示す図である。
図15において横軸は時間であり、縦軸は、その時間軸上の時刻の視差である。
図15において実線は、UI視差301の変動を示す。白丸は、UI視差が更新される時刻の各々における更新後のUI視差を示す。一点鎖線および2点鎖線の軌跡は、字幕視差302および303の変動を示す。また、点線の軌跡は、動画視差304の変動を示す。
【0068】
図15におけるaは、視差の補正を行わない場合の視差の軌跡を示す図である。例えば、時刻t
1からt
2までの期間における最大視差M
2+補正量αの値が、時刻t
3からt
4までの期間のUI視差として設定された場合を考える。この時刻t
2からt
3までの期間内において、字幕視差303が急激に変動して、UI視差より大きくなると、UI画像の手前に動画が立体表示されてしまう。
【0069】
図15におけるbは、視差を補正する場合の視差の軌跡を示す図である。時刻t
2からt
3までの期間内において、そのUI視差以上の字幕視差303が取得されると、視差補正部215が、UI視差未満の値(UI視差−1など)に動画視差303を補正する。これにより、それぞれの期間内において、そのUI視差より大きな動画視差および字幕視差が設定されなくなる。これにより、動画視差や字幕視差が急激に変動した場合においても常にUI画像が最も手前に立体表示される。
【0070】
このように本技術の第2の実施の形態によれば、画像処理装置200は、UI視差未満の値に動画視差および字幕視差を補正することにより、動画視差や字幕視差が急激に変動した場合においても常にUI画像を最も手前に立体表示させることができる。これにより、さらに操作性が向上する。
【0071】
<3.第3の実施の形態>
[UI視差生成部の構成例]
図16は、第3の実施の形態におけるUI視差生成部250の一構成例を示すブロック図である。第1の実施の形態においてUI視差生成部250はUI画像の表示位置を段階的に変更していたが、表示位置が滑らかに変わる方が視聴者にとってUI画像が見やすくなる。第3の実施の形態のUI視差生成部250は、UI画像の表示位置の変化を滑らかにする点において第1の実施の形態と異なる。具体的には、第3の実施の形態のUI視差生成部250は、曲線近似部254をさらに備える点において第1の実施の形態と異なる。
【0072】
曲線近似部254は、最大視差の時間軸上の変化を表わす軌跡を曲線に近似するものである。具体的には、曲線近似部254は、視差の時間軸上の変化を表わす関数を、例えば、次の式2により定義しておく。
【数1】
式2において、tは時刻であり、単位は例えば、ミリ秒である。D(t)は、時間軸上の視差の変化を表わす関数である。a、b、cおよびdは、実数の係数である。曲線近似部254は、最大視差の時間軸上の変化を表わす軌跡に近似するD(t)の係数を求める。この係数は、最小二乗法に基づいて正規方程式を解くことにより求められる。なお、D(t)をtの3次関数としているが、軌跡が曲線となる関数であれば、D(t)は3次関数に限定されない。例えばD(t)は、3次関数以外のn(nは2以上の整数)次関数や三角関数であってもよい。
【0073】
ここで、正規方程式の導出方法について説明する。取得された最大視差のうち、時刻t
k(kは1以上の整数)において取得された最大視差をD
kとする。この場合、式2にt
kを代入して求められる視差と、取得されたD
kとの差分e
kは、次の式3により求められる。
【数2】
【0074】
最小二乗法において、最適な係数群は、次の式4で表わされる二乗和Eを最小にすることで求められる。
【数3】
【0075】
上式において、Kは、取得された最大視差の総数であり、少なくともD(t)の次数(式2においては「3」)より大きい整数(例えば、「4」)である。二乗和Eを最小にする係数の値は、その係数による二乗和Eの偏微分が「0」になるときの値である。下記式5は、二乗和Eを係数のそれぞれ(a、b、cおよびd)で偏微分したものである。
【数4】
【0076】
上式において偏微分が0になる係数群が最適な係数群である。式5から次の式6が得られる。
【数5】
【0077】
ここで、式2により定義されたD(t)を係数のそれぞれ(a、b、cおよびd)で偏微分すると、次の式7が得られる。
【数6】
この式7を式6に代入することにより、次の式8が得られる。
【数7】
【0078】
そして、式8のe
kに式3を代入することにより、次の式9が得られる。
【数8】
【0079】
この式9を展開することにより、次の式910が得られる。
【数9】
【0080】
式10は、行列を用いて、正規方程式である次の式11で表される。
【数10】
【0081】
この式11は、例えば、掃き出し法(Gauss-Jordanの消去法)などを用いることにより、それぞれの係数について解くことができる。これにより、二乗和Eが最小となる係数(a、b、cおよびd)の各々が求められる。
【0082】
曲線近似部254は、K個の最大視差D
kおよび時刻t
kを式11に代入して、係数のそれぞれを求め、UI視差算出部255に供給する。UI視差算出部255は、それらの係数を設定した式2を使用して、時刻t
kにおける最大視差D(t
k)を算出する。そして、UI視差算出部255は、その最大視差にαを加えた視差をUI視差として算出する。
【0083】
ここで、動画視差および字幕視差は、一定の規則に従って変動するとは限らないため、曲線近似部254は、一定期間ごとに関数の係数を更新する。例えば、曲線近似部254は、100ミリ秒ごとに係数を算出して更新する。
【0084】
また、最大視差を複数取得して係数を算出するための期間は、その算出した係数を適用する期間を含む。例えば、UI視差生成部250は、時刻t
a+1、t
a+2、t
a+3およびt
a+4(aは整数)の時刻における最大視差D
1、D
2、D
3およびD
4を予め視差バッファ230から取得しておく。そして、UI視差生成部250は、それらの視差から算出した係数を使用して時刻t
a+2からt
a+3までの期間におけるUI視差を算出する。なお、算出した係数は、その係数を算出するための期間(時刻t
a+1乃至t
a+4の期間)内であれば、任意の期間に適用することができる。例えば、時刻t
a+3からt
a+4までの期間に係数を適用してもよい。
【0085】
図17は、第3の実施の形態におけるUI視差の変化の一例を示す図である。
図17において横軸は時刻であり、縦軸は、その時刻における視差である。UI視差生成部250は、例えば、時刻t
1、t
2、t
3およびt
4における4つの最大視差から求めた係数を式2に設定し、その式2を使用して時刻t
2からt
3までの期間におけるUI視差を算出する。同様の手順により、時刻t
2、t
3、t
4およびt
5における4つの最大視差から求めた係数を設定した式2を使用して、時刻t
3からt
4までの期間におけるUI視差が算出される。式2などにより定義される関数に近似することにより、画像処理装置200は、軌跡が曲線を描くようにUI視差を変更することできる。
【0086】
このように、第3の実施の形態によれば、画像処理装置200は、最大視差の時間軸上の変化の軌跡を曲線に近似し、その曲線に基づいてUI視差の変化を滑らかにすることができる。これにより、UI画像の奥行き方向における表示位置の変化が滑らかになるため、UI画像が見やすくなり、機器の操作性が向上する。
【0087】
なお、上述の実施の形態は本技術を具現化するための一例を示したものであり、実施の形態における事項と、特許請求の範囲における発明特定事項とはそれぞれ対応関係を有する。同様に、特許請求の範囲における発明特定事項と、これと同一名称を付した本技術の実施の形態における事項とはそれぞれ対応関係を有する。ただし、本技術は実施の形態に限定されるものではなく、その要旨を逸脱しない範囲において実施の形態に種々の変形を施すことにより具現化することができる。
【0088】
また、上述の実施の形態において説明した処理手順は、これら一連の手順を有する方法として捉えてもよく、また、これら一連の手順をコンピュータに実行させるためのプログラム乃至そのプログラムを記憶する記録媒体として捉えてもよい。この記録媒体として、例えば、CD(Compact Disc)、MD(MiniDisc)、DVD(Digital Versatile Disk)、メモリカード、ブルーレイディスク(Blu-ray Disc(登録商標))等を用いることができる。
【0089】
なお、本技術は以下のような構成もとることができる。
(1)時系列順に複数の立体画像を含む動画における前記複数の立体画像の各々の視差を動画視差として取得する視差取得部と、
一定期間内に取得された前記動画視差に対応する前記複数の立体画像のいずれよりも手前の位置をユーザインターフェース画像の表示位置とする視差をユーザインターフェース視差として生成する視差生成部と
を具備する画像処理装置。
(2)前記視差取得部は、前記複数の立体画像の各々に合成される複数の立体字幕画像の視差を字幕視差としてさらに取得し、
前記視差生成部は、前記一定期間内に取得された前記動画視差に対応する前記複数の立体画像と前記字幕視差に対応する前記複数の立体字幕画像とのいずれよりも手前の位置を前記ユーザインターフェース画像の表示位置とする視差をユーザインターフェース視差として生成する
前記(1)記載の画像処理装置。
(3)前記視差生成部は、前記一定期間内に取得された前記複数の立体画像のうち最も手前の画像より所定距離手前の位置を前記ユーザインターフェース画像の表示位置とする視差をユーザインターフェース視差として生成する
前記(1)または(2)記載の画像処理装置。
(4)前記ユーザインターフェース画像より手前の位置を前記立体画像の表示位置とする前記動画視差が取得された場合には当該動画視差を前記ユーザインターフェース画像より奥の位置を表示位置とする値に補正する視差補正部をさらに具備する
前記(1)乃至(3)のいずれかに記載の画像処理装置。
(5)前記視差生成部は、
複数の前記一定期間の各々において当該一定期間内に取得された前記複数の立体画像立体字幕画像の表示位置のうち最も手前に表示される画像の視差を最大視差として選択する最大視差選択部と、
前記最大視差の時間軸上の変化の軌跡に近似する曲線を求める曲線近似部と、
前記曲線により表わされる近似視差の時間軸上の変化に基づいて前記近似視差に応じた表示位置よりも手前の位置を前記ユーザインターフェース画像の表示位置とする視差を前記ユーザインターフェース視差として生成するユーザインターフェース視差生成部と
を備える前記(1)乃至(4)のいずれかに記載の画像処理装置。
(6)前記ユーザインターフェース視差に応じた位置を表示位置とする前記ユーザインターフェース画像を前記複数の立体画像の各々に合成する画像合成部をさらに具備する前記(1)乃至(5)のいずれかに記載の画像処理装置。
(7)時系列順に複数の立体画像を含む動画における前記複数の立体画像の各々の視差を動画視差として取得する視差取得部と、
一定期間内に取得された前記動画視差に対応する前記複数の立体画像のいずれよりも手前の位置をユーザインターフェース画像の表示位置とする視差をユーザインターフェース視差として生成する視差生成部と、
前記ユーザインターフェース視差に応じた位置を表示位置とする前記ユーザインターフェース画像が合成された前記複数の立体画像を表示する表示部と
を具備する情報処理システム。
(8)視差取得部が、時系列順に複数の立体画像を含む動画における前記複数の立体画像の各々の視差を動画視差として取得する視差取得手順と、
視差生成部が、一定期間内に取得された前記動画視差に対応する前記複数の立体画像のいずれよりも手前の位置をユーザインターフェース画像の表示位置とする視差をユーザインターフェース視差として生成する視差生成手順と
を具備する画像処理方法。
(9)視差取得部が、時系列順に複数の立体画像を含む動画における前記複数の立体画像の各々の視差を動画視差として取得する視差取得手順と、
視差生成部が、一定期間内に取得された前記動画視差に対応する前記複数の立体画像のいずれよりも手前の位置をユーザインターフェース画像の表示位置とする視差をユーザインターフェース視差として生成する視差生成手順と
をコンピュータに実行させるためのプログラム。