【文献】
社団法人映像情報メディア学会 編,総合マルチメディア選書 MPEG,日本,株式会社オーム社,1996年 4月20日,初版,p.72〜85,ISBN 4-274-07840-X
(58)【調査した分野】(Int.Cl.,DB名)
上記基本ビデオストリームと上記所定数の拡張ビデオストリームが1つのビデオエレメンタリストリームに挿入されて受信される場合、各ビデオストリームの間にストリーム境界を示す情報が配置されている
請求項14に記載の受信装置。
上記コンテナのレイヤに挿入されている識別情報には、上記1つまたは複数のビデオストリームが1つのビデオエレメンタリストリームで供給されるか否かを示す情報が付加されている
請求項16に記載の受信装置。
上記第1の送信モードでは、上記ビデオストリームに、該第1の送信モードであることを示す識別情報が挿入されており、上記第2の送信モードでは、上記ビデオストリームに、上記識別情報が挿入されていない
請求項7または8に記載の受信装置。
【発明を実施するための形態】
【0025】
以下、発明を実施するための形態(以下、「実施の形態」とする)について説明する。なお、説明は以下の順序で行う。
1.実施の形態
2.変形例
【0026】
<1.実施の形態>
[画像送受信システム]
図1は、実施の形態としての画像送受信システム10の構成例を示している。この画像送受信システム10は、放送局100および受信機200により構成されている。放送局100は、コンテナとしてのトランスポートストリームTSを放送波に載せて送信する。
【0027】
第1の送信モードにある場合、すなわち、空間的あるいは時間的な超高解像度画像の表示を可能とするためのスケーラブル符号化画像データの送信時には、トランスポートストリームTSに、複数のビデオストリーム(ビデオサブストリーム)が含まれる。この場合、トランスポートストリームTSに、スケーラブル符号化画像データを構成する最下位階層の画像データを含む基本ビデオストリームと、スケーラブル符号化画像データを構成する最下位階層以外の階層の画像データをそれぞれ含む所定数の拡張ビデオストリームが含まれる。
【0028】
また、第2の送信モードにある場合、すなわち、従来画像(例えば、HD解像度、25fps、30fps画像など)の画像データの送信時には、トランスポートストリームTSに、1つのビデオストリーム(ビデオサブストリーム)が含まれる。この場合、トランスポートストリームTSに、従来画像の画像データを基本画像データとして含む基本ビデオストリームのみが含まれる。
【0029】
図2(a)は、従来画像の画像データとして、有効画素数が1920*1080であるHD画像の画像データを示している。
図2(b)は、空間的に超高解像度の画像データとして、HD(High-Definition)に対して有効画素数が水平、垂直にそれぞれ2倍の4Kの画像データを示している。
図2(c)は、空間的に超高解像度の画像データとして、HDに対して有効画素数が水平、垂直にそれぞれ4倍の8Kの画像データを示している。
【0030】
図3(a)は、従来画像の画像データとして、フレーム周波数が60Hzである60fpsの画像データを示している。
図3(b)は、時間的に超高解像度の画像データとして、フレーム周波数が120Hzである120fpsの画像データを示している。
図3(c)は、時間的に超高解像度の画像データとして、フレーム周波数が240Hzである240fpsの画像データを示している。
【0031】
図4は、空間解像度スケーラビリティの一例を示している。この例は、空間的に超高解像度の画像データとして、例えば、8Kの画像データS-8Kを取り扱う例である。最初に送信側(エンコード側)について説明する。画像データS-8Kに対して、ダウンサンプリング部301で1/β倍、ここでは1/2倍のダウンサンプリング処理が施されて、4Kの画像データS-4Kが生成される。また、この画像データS-4Kに対して、ダウンサンプリング部302で1/α倍、ここでは1/2倍のダウンサンプリング処理が施されて、HDの画像データS-HDが生成される。
【0032】
また、画像データS-HDに対して、アップサンプリング部303でα倍、ここでは2倍のアップサンプリング処理が施されて、4Kの画像データS-4K_Lが生成される。この4Kの画像データS-4K_Lは、画像データS-4Kに対して、ダウンサンプリング処理およびアップサンプリング処理が施されたものであり、4Kレベルの高周波成分が欠如したものとなる。減算器304において、画像データS-4Kから画像データS-4K_Lが減算されて、4Kレベルの高周波成分S-4K_Hが生成される。
【0033】
また、画像データS-4Kに対して、アップサンプリング部305でβ倍、ここでは2倍のアップサンプリング処理が施されて、8Kの画像データS-8K_Lが生成される。この8Kの画像データS-8K_Lは、画像データS-8Kに対して、ダウンサンプリング処理およびアップサンプリング処理が施されたものであり、8Kレベルの高周波成分が欠如したものとなる。減算器306において、画像データS-8Kから画像データS-8K_Lが減算されて、8Kレベルの高周波成分S-8K_Hが生成される。
【0034】
画像データS-HDは、第1階層(最下位階層)の画像データを構成する。この画像データS-HDがビデオエンコーダ307において符号化されることで、基本ビデオストリームSt1が得られる。この基本ビデオストリームSt1は、エンコードバッファ308に、一時的に蓄積される。また、4Kレベルの高周波成分S-4K_Hは、第2階層の画像データを構成する。この高周波成分S-4K_Hがビデオエンコーダ309において符号化されることで、第1の拡張ビデオストリームSt2が得られる。この第1の拡張ビデオストリームSt2は、エンコードバッファ310に、一時的に蓄積される。
【0035】
また、8Kレベルの高周波成分S-8K_Hは、第3階層の画像データを構成する。この高周波成分S-8K_Hがビデオエンコーダ311において符号化されることで、第2の拡張ビデオストリームSt3が得られる。この第2の拡張ビデオストリームSt3は、エンコードバッファ312に、一時的に蓄積される。基本ビデオストリームSt1、第1の拡張ビデオストリームSt2および第2拡張ビデオストリームSt3は、マルチプレクサ313で合成され、合成ストリームが受信側に送信される。
【0036】
次に、受信側(デコード側)について説明する。デマルチプレクサ351で、合成ストリームから、基本ビデオストリームSt1、第1の拡張ビデオストリームSt2および第2拡張ビデオストリームSt3が分離される。基本ビデオストリームSt1は、デコードバッファ352に、一時的に蓄積される。そして、この基本ビデオストリームSt1がデコーダ353で復号化されることで、第1階層(最下位階層)の画像データとして、HDの画像データS-HDが得られる。この画像データS-HDにより、HD画像の表示が可能となる。
【0037】
また、第1の拡張ビデオストリームSt2は、デコードバッファ354に、一時的に蓄積される。そして、この第1の拡張ビデオストリームSt2がデコーダ355で復号化されることで、第2階層の画像データとしての4Kレベルの高周波成分S-4K_Hが得られる。また、画像データS-HDに対して、アップサンプリング部356でα倍、ここでは2倍のアップサンプリング処理が施されて、4Kの画像データS-4K_Lが生成される。加算器357において、4Kの画像データS-4K_Lに4Kレベルの高周波成分S-4K_Hが加算されて、4Kの画像データS-4Kが得られる。この画像データS-4Kにより、4K画像の表示が可能となる。
【0038】
また、第2の拡張ビデオストリームSt3は、デコードバッファ358に、一時的に蓄積される。そして、この第2の拡張ビデオストリームSt3がデコーダ359で復号化されることで、第3階層の画像データとしての8Kレベルの高周波成分S-8K_Hが得られる。また、画像データS-4Kに対して、アップサンプリング部360でβ倍、ここでは2倍のアップサンプリング処理が施されて、8Kの画像データS-8K_Lが生成される。加算器361において、8Kの画像データS-8K_Lに8Kレベルの高周波成分S-8K_Hが加算されて、8Kの画像データS-4Kが得られる。この画像データS-8Kにより、8K画像の表示が可能となる。
【0039】
図5は、上述した空間解像度スケーラビリティにおける受信側(デコード側)の具体的な構成例を示している。なお、この構成例は2レイヤ(第1階層、第2階層)の場合を示している。基本ビデオストリームSt1は、エントロピーデコーディング部353aでエントロピーデコード処理が行われ、クオンタイズィングデコーディング部353bで逆量子化処理が行われる。さらに、逆量子化処理後のデータは、フリクェンシーコンバージョンデコーダ353cで、周波数軸データから時間軸データに戻されて、データD1(n)が得られる。
【0040】
加算器353fにおいて、このフリクェンシーコンバージョンデコード後のデータD1(n)に、フレームバッファ353dから得られる1フレーム前の画像データS-HD(n-1)がモーションコンペンセーション部353eで動き補償処理された後に加算される。そして、この加算器353fから、現在フレームのHDの画像データS-HD(n)が得られる。
【0041】
また、第1拡張ビデオストリームSt2は、エントロピーデコーディング部355aでエントロピーデコード処理が行われ、クオンタイズィングデコーディング部355bで逆量子化処理が行われる。さらに、逆量子化処理後のデータは、フリクェンシーコンバージョンデコーダ355cで、周波数軸データから時間軸データに戻されて、データD2(n)が得られる。
【0042】
加算器355fにおいて、このフリクェンシーコンバージョンデコード後のデータD2(n)に、フレームバッファ355dから得られる1フレーム前の高周波成分S-4K_H(n-1)がモーションコンペンセーション部355eで動き補償処理された後に加算される。この加算器355fから、現在フレームの4Kレベルの高周波成分S-4K_H(n)が得られる。また、画像データS-HD(n)に対して、アップサンプリング部356でα倍、ここでは2倍のアップサンプリング処理が施されて、4Kの画像データS-4K_L(n)が生成される。加算器357において、4Kの画像データS-4K_L(n)に4Kレベルの高周波成分S-4K_H(n)が加算されて、現在フレームの4Kの画像データS-4K(n)が得られる。
【0043】
図6は、空間解像度スケーラビリティのデコーディングプロセスの一例を示している。この例では、第1階層(最下位階層)の画像データを含む基本ビデオストリーム(Base stream)が存在する。また、この例では、第2の階層の画像データ(高周波成分)を含む第1の拡張ビデオストリーム(1st enhancement stream)および第3の階層の画像データ(高周波成分)を含む第2の拡張ビデオストリーム(2nd enhancement stream)が存在する。そして、この例は、基本ビデオストリームの空間解像度を、第1の拡張ビデオストリームにより、‘Up scaling ratio 1’倍とし、第2の拡張ビデオストリームにより、さらに‘Up scaling ratio 2’倍とする例である。
【0044】
基本ビデオストリームがデコードされて第1階層の画像データV1が得られる。この画像データV1がアップサンプリングされることで、水平、垂直の解像度がそれぞれ‘Up scaling ratio 1’倍された画像データV2Lが得られる。また、第1の拡張ビデオストリームがデコードされて第2階層の画像データV2Hが得られる。画像データV2L,V2Hが加算されて、画像データV1に対して、水平、垂直の解像度がそれぞれ‘Up scaling ratio 1’倍された画像データV2が得られる。
【0045】
また、画像データV2がアップサンプリングされることで、水平、垂直の解像度がそれぞれ‘Up scaling ratio 2’倍された画像データV3Lが得られる。また、第2の拡張ビデオストリームがデコードされて第3階層の画像データV3Hが得られる。画像データV3L,V3Hが加算されて、画像データV2に対して、水平、垂直の解像度がそれぞれ‘Up scaling ratio 2’倍された表示用の画像データV3が得られる。
【0046】
図7は、時間解像度スケーラビリティの一例を示している。この例は、時間的に超高解像度の画像データとして、
図7(a)に示すように、120fpsの画像データS-120を取り扱う例である。この画像データS-120は、第1階層(最下位階層)と第2階層の2階層に分離される。
【0047】
第1階層の画像データ(偶数フレームの画像データ)は、例えば、
図7(b)に示すように、符号化されて、基本ビデオストリームSt1が生成される。この基本ビデオストリームSt1は、Iピクチャ(Intra picture)、Pピクチャ(Predictive picture)およびBピクチャ(Bi-directional predictive picture)で構成される。Iピクチャは他ピクチャを参照せず、PピクチャおよびBピクチャは、この基本ビデオストリームSt1内のIピクチャまたはPピクチャしか参照しない。そのため、この基本ビデオストリームSt1は、このストリームだけでデコード可能となる。
【0048】
また、第2階層の画像データ(奇数フレームの画像データ)は、例えば、
図7(c)に示すように、符号化されて、第1の拡張ビデオストリームSt2が生成される。この第1の拡張ビデオストリームSt2は、PピクチャおよびBピクチャで構成される。PピクチャおよびBピクチャは、この第1の拡張ビデオストリームSt2内のPピクチャだけでなく、基本ビデオストリームSt1内のIピクチャ、Pピクチャ、さらにはBピクチャも参照する。そのため、この第1の拡張ビデオストリームSt2は、このストリームだけでなく、基本ビデオストリームSt1のデコード結果が必要となる。
【0049】
なお、
図7(c)に示す第1の拡張ビデオストリームSt2のBピクチャは「B」で示されるのに対して、
図7(b)に示す基本ビデオストリームSt1のBピクチャは「Br」で示されている。「B」は他のピクチャから参照されないBピクチャであることを表し、「Br」は他のピクチャから参照されるBピクチャであることを表している。
【0050】
送信側(エンコード側)から受信側(デコード側)には、上述した基本ビデオストリームSt1および第1の拡張ビデオストリームSt2が送られる。受信側では、基本ビデオストリームSt1を復号化することで、60fpsの画像データS-60を得ることができる。また、受信側では、基本ビデオストリームSt1および第1の拡張ビデオストリームSt2の双方を復号化して合成することで、120fpsの画像データS-120を得ることができる。
【0051】
図8は、上述した基本ビデオストリームSt1および第1の拡張ビデオストリームSt2が送られる場合におけるデコード例を示している。基本ビデオストリームのSt1に関しては、第0フレームのIピクチャ(I_0)、第6フレームのPピクチャ(P_6)、第2フレームのBピクチャ(Br_2)、第4フレームのBピクチャ(Br_4)、・・・の順にデコード処理が行われる。なお、図中の矢印は、ピクチャの参照関係を示している。このように基本ビデオストリームSt1のデコードが行われることで、60fpsの画像データS-60が得られる。
【0052】
また、第1の拡張ビデオストリームSt2に関しては、第1フレームのPピクチャ(P_1)、第7フレームのPピクチャ(P_7)、第3フレームのBピクチャ(B_3)、第5フレームのBピクチャ(B_5)、・・・の順にデコード処理が行われる。なお、図中の矢印は、ピクチャの参照関係を示している。上述の基本ビデオストリームSt1のデコードの他に、このように第1の拡張ビデオストリームSt2のデコードが行われることで、120fpsの画像データS-120が得られる。
【0053】
図9は、上述した時間解像度スケーラビリティにおける受信側(デコード側)の具体的な構成例を示している。なお、この構成例は2レイヤ(第1階層、第2階層)の場合を示している。基本ビデオストリームSt1は、エントロピーデコーディング部403aでエントロピーデコード処理が行われ、クオンタイズィングデコーディング部403bで逆量子化処理が行われる。さらに、逆量子化処理後のデータは、フリクェンシーコンバージョンデコーダ403cで、周波数軸データから時間軸データに戻されて、現在フレームのデコードデータD1(n)が得られる。
【0054】
加算器403fにおいて、このデコードデータD1(n)に、フレームバッファ403dから得られる参照ピクチャの画像データがモーションコンペンセーション部403e部で動き補償処理された後に加算される。そして、この加算器403fから、現在フレームの60fpsの画像データS-60(n)が得られる。
【0055】
また、第1拡張ビデオストリームSt2は、エントロピーデコーディング部405aでエントロピーデコード処理が行われ、クオンタイズィングデコーディング部405bで逆量子化処理が行われる。さらに、逆量子化処理後のデータは、フリクェンシーコンバージョンデコーダ405cで、周波数軸データから時間軸データに戻されて、現在フレームのデコードデータD2(n)が得られる。
【0056】
加算器405fにおいて、このデコードデータD2(n)に、フレームバッファ403dやフレームバッファ405dから得られる参照ピクチャの画像データがモーションコンペンセーション部405e部で動き補償処理された後に加算される。この加算器405fから、現在フレームの60fpsの画像データS-60(n)′が得られる。そして、合成部406において、上述の60fpsの画像データS-60(n)に、この60fpsの画像データS-60(n)′が合成されて、120fpsの画像データS-120が得られる。
【0057】
1つまたは複数のビデオストリーム(ビデオサブストリーム)は、1つまたは複数のビデオエレメンタリストリームに挿入して送信される。すなわち、トランスポートストリームTSには、1つまたは複数のビデオエレメンタリストリームが含まれる。基本ビデオストリームおよび所定数の拡張ビデオストリームを1つのビデオエレメンタリストリームに挿入して送信する場合、1アクセスユニット(access unit)の中に、全てのストリームのピクチャが含まれる
【0058】
図10は、時間解像度スケーラビリティのデコーディングプロセスの一例を示している。なお、図中の矢印は、ピクチャの被参照方向を示している。この例では、第1階層(最下位階層)の画像データを含む基本ビデオストリーム(Base stream)が存在する。また、この例では、第2の階層の画像データを含む第1の拡張ビデオストリーム(1st enhancement stream)および第3の階層の画像データを含む第2の拡張ビデオストリーム(2nd enhancement stream)が存在する。そして、この例は、基本ビデオストリームのフレーム表示周波数を、第1の拡張ビデオストリームにより、2倍とし、第2の拡張ビデオストリームにより、さらに2倍とする例である。
【0059】
そして、この例は、基本ビデオストリームと第1の拡張ビデオストリームとの間で、拡張層(Enhanced layer)のピクチャ挿入が1ピクチャであり、また、第1の拡張ビデオストリームと第2の拡張ビデオストリームとの間で、拡張層(Enhanced layer)のピクチャ挿入が1ピクチャである。
【0060】
基本ビデオストリームの各ピクチャは、この基本ビデオストリーム内のピクチャのみが参照されてデコードされる。第1の拡張ビデオストリームの各ピクチャは、基本ビデオストリーム内のピクチャが参照されてデコードされる。また、第2の拡張ビデオストリームの各ピクチャは、基本ビデオストリーム内および第1の拡張ビデオストリーム内のピクチャが参照されてデコードされる。
【0061】
このように、基本ビデオストリーム、第1の拡張ビデオストリームおよび第2の拡張ビデオストリームがデコードされることで、最終的に、基本ビデオストリームのフレーム表示周波数に対して4倍の表示周波数を有する画像データが得られる。
【0062】
図11(a),(b)は、複数のビデオストリーム(サブストリーム)のピクチャの符号化データを含むビデオエレメンタリストリームの一例を示している。各アクセスユニットに、各サブストリームのピクチャの符号化データが順次配置される。この場合、最初のサブストリームのピクチャの符号化データは、“SPS 〜 Coded Slice”で構成され、2番目以降のサブストリームのピクチャの符号化データは、“Subset SPS 〜 Coded Slice”で構成される。なお、この例は、MPEG4−AVCの符号化がされている例であるが、他の符号化方式でも適用可能である。なお、図中の16進数字は「 NAL unit type 」を示している。
【0063】
各サブストリームのピクチャの符号化データが1つのビデオエレメンタリストリームに共存する場合、各ピクチャの境界が瞬時に識別可能なことが要求される。しかし、AUD(access unit delimiter)は、一つのアクセスユニットの先頭にのみ付すことが可能である。そこで、
図11(b)に示すように、各サブストリームのピクチャの符号化データの間に、「Substream Separation Marker」という境界を示す新たな“NAL unit”を定義して配置することが考えられる。
【0064】
これにより、各サブストリームのピクチャの先頭データに瞬時にアクセスすることが可能となる。なお、
図11(a)は、各サブストリームのピクチャの符号化データの間に、「Substream Separation Marker」が配置されていない例を示している。
【0065】
図12は、第1の送信モードと、第2の送信モードが交互に連続する場合であって、モード識別のための識別情報(シグナリング)がない例を示している。期間A、期間Cは第1の送信モードにある期間を示し、期間Bは第2の送信モードにある期間を示している。各期間は、例えば、番組単位、あるいはシーン単位を表す。
【0066】
第1の送信モードの期間には、基本ビデオストリームと共に、空間的あるいは時間的な超高解像度化のための拡張ビデオストリームが存在する。第2の送信モードの期間には、基本ビデオストリームのみが存在する。なお、基本ビデオストリームは、SPSを先頭として、所定数のアクセスユニット(AU)が続く構成となっている。また、拡張ビデオストリームは、サブセットSPS(SSSPS)を先頭として、所定数のアクセスユニット(AU)が続く構成となっている。また、アクセスユニット(AU)は、“PPS, Substream SEIs, Coded Slice”で構成されている。
【0067】
期間Aから期間Bへの切換えタイミングにおいて、受信機の受信バッファへの拡張ビデオストリームの供給がなくなった際に、エンコーダあるいは伝送路の都合で到着に余計な時間がかかっているのか、あるいは拡張ビデオストリームのエンコードが途絶えて、基本ビデオストリームのみになったのかは、受信機としては不明である。その場合、受信機側のバッファは必要以上に待ちが生じることがあり、結果としてアンダーフロー(underflow)になる可能性がある。
【0068】
そうなった場合は、受信機の判断で、例えば、予め設定したタイムアウト(timeout)時間との比較を行うことにより、超高解像度画像から基本画像(従来画像)の表示モードへ変更する、など行う。しかし、このような判断を受信機が行う場合、そのための処理時間がかかり、瞬時に判断することは困難である。つまり、ストリーム構成の変化、つまり、配信内容の動的な変化に的確に対応でき、正しいストリーム受信を行うことができなくなる。
【0069】
そのような状態に陥ることを回避するには、送信モードの切り替えに同期したモード識別情報(シグナリング)を供給し、受信機がその信号を検出することで、送信モードの切り替え時点を瞬時に判断できるようにすることが必要となる。この実施の形態においては、ビデオストリームに、第1の送信モードと第2の送信モードとを識別するための識別情報が挿入される。
【0070】
識別情報の挿入は、例えば、以下の「方法1」、「方法2」あるいは「方法3」により行われる。「方法1」は、
図13に示すように、ビデオストリームに第1の送信モードであることを示す識別情報「EHF」あるいは第2の送信モードであること(拡張ビデオストリームが存在しないこと)を示す識別情報「BCF」の挿入を行う。すなわち、第1の送信モードでは、ビデオストリームに識別情報「EHF」を挿入し、第2の送信モードではビデオストリームに識別情報「BCF」を挿入する、というものである。
【0071】
「方法2」は、
図14に示すように、ビデオストリームに第1の送信モードであること(拡張ビデオストリームが存在すること)を示す識別情報「EHF」の挿入を行う。すなわち、第1の送信モードでは、ビデオストリームに識別情報「EHF」を挿入し、第2の送信モードでは、ビデオストリームに、識別情報を挿入しない、というものである。
【0072】
「方法3」は、
図15に示すように、ビデオストリームに第2の送信モードであることを示す識別情報「BCF」の挿入を行う。すなわち、第1の送信モードでは、ビデオストリームに、識別情報を挿入することをせず、第2の送信モードでは、ビデオストリームに識別情報「BCF」を挿入する、というものである。
【0073】
この識別情報には、第1の送信モードを示す場合、つまり識別情報「EHF」の場合には、拡張ビデオストリームの個数を示す情報、スケーラビリティ拡張のタイプを示す情報、スケーラビリティ拡張における上位階層との合成の際のスケーリング比の情報等が含まれている。
【0074】
この識別情報は、例えば、ビデオストリームのピクチャヘッダまたはシーケンスヘッダのユーザデータ領域などに挿入される。この識別情報は、少なくとも、番組単位、シーン単位、ピクチャグループ単位、あるいはピクチャ単位で挿入される。なお、上述の
図13、
図14、
図15に示す例は、ピクチャ単位で挿入される例を示している。
【0075】
上述したようにビデオストリームに送信モードの識別情報を挿入することで、受信側では、送信モードの切り替えに応じて、超高解像度画像の表示処理または従来画像の表示処理を適切に切り替えることができる。なお、従来画像の表示処理を行う際には解像度アップ処理が施される。この識別情報(「EHF」、「BCF」)の詳細については後述する。
【0076】
また、トランスポートストリームTSのレイヤに、第1の送信モードにあるか第2の送信モードにあるかを識別するための識別情報が挿入される。この識別情報は、イベント単位あるいは時間的に静的または動的なユースケースにおいて、最適な位置に配置される。例えば、この識別情報は、トランスポートストリームTSに含まれるプログラム・マップ・テーブル(PMT:Program Map Table)のビデオエレメンタリ・ループ(Video ES loop)の配下に挿入される。この識別情報により、受信側では、第1の送信モードにあるか第2の送信モードにあるかを、ビデオストリームをデコードすることなく、大まかに把握することが可能となる。
【0077】
第1の送信モードを示す場合、拡張ビデオストリームの個数を示す情報、スケーラビリティ拡張のタイプを示す情報、所定数の拡張ビデオストリームが1つのビデオエレメンタリストリームで供給されるか否かを示す情報等が含まれている。この識別情報の詳細については後述する。
【0078】
また、トランスポートストリームTSのレイヤに、1つまたは複数のビデオストリーム(サブストリーム)を挿入するビデオエレメンタリストリームの個数を識別するための識別情報が挿入される。この識別情報は、イベント単位あるいは時間的に静的または動的なユースケースにおいて、最適な位置に配置される。例えば、この識別情報は、トランスポートストリームTSに含まれるプログラム・マップ・テーブル(PMT:Program Map Table)のプログラム・ループ(Program_loop)の配下に挿入される。この識別情報により、受信側では、デコードすべきビデオエレメンタリストリームの個数を把握することが可能となる。この識別情報の詳細については後述する。
【0079】
受信機200は、放送局100から放送波に載せて送られてくるトランスポートストリームTSを受信する。また、受信機200は、第1の送信モードの期間は、このトランスポートストリームTSに含まれるビデオストリーム(基本ビデオストリーム、所定数の拡張ビデオストリーム)をデコードして、超高解像度画像の表示画像データを取得する。また、受信機200は、第2の送信モードの期間は、このトランスポートストリームTSに含まれるビデオストリーム(基本ビデオストリーム)をデコードして、従来画像の表示画像データを取得する。
【0080】
「送信データ生成部の構成例」
図16は、放送局100において、上述したトランスポートストリームTSを生成する送信データ生成部110の構成例を示している。この送信データ生成部110は、画像データ出力部111と、ビデオエンコーダ112と、グラフィクスデータ出力部113と、グラフィクスエンコーダ114と、音声データ出力部115と、オーディオエンコーダ116と、マルチプレクサ117を有している。
【0081】
最初に、第1の送信モードにある場合について説明する。画像データ出力部111は、空間的あるいは時間的な超高解像度画像の画像データを出力する。この画像データ出力部111は、例えば、被写体を撮像して画像データを出力するカメラ、あるいは記憶媒体から画像データを読み出して出力する画像データ読み出し部などにより構成される。この画像データとしては、例えば、空間的な超高解像度画像を表示する、4Kの画像データ、8Kの画像データ等が該当する。また、この画像データとしては、例えば、時間的な超高解像度画像を表示する、120fpsの画像データ、240fpsの画像データ等が該当する。
【0082】
ビデオエンコーダ112は、画像データ出力部111から出力される画像データに対してスケーラブル符号化の処理を行って、最下位階層の画像データを含む基本ビデオストリーム(サブストリーム)と、最下位層以外の階層の画像データをそれぞれ含む所定数の拡張ビデオストリーム(サブストリーム)を生成する。各ビデオストリーム(サブストリーム)には、例えば、MPEG4−AVC、MPEG2video等の符号化が施される。そして、ビデオエンコーダ112は、後段に備えるストリームフォーマッタ(図示せず)により、基本ビデオストリームおよび所定数の拡張ビデオストリームが挿入された1つまたは複数のビデオエレメンタリストリームを生成する。
【0083】
ビデオエンコーダ112は、上述の「方法1」、あるいは「方法2」を採用する場合には、基本ビデオストリームに、第1の送信モードであることを示す識別情報「EHF」を挿入する。この識別情報「EHF」には、拡張ビデオストリームの個数を示す情報、スケーラビリティ拡張のタイプを示す情報、スケーラビリティ拡張における上位階層との合成の際のスケーリング比の情報等が含まれている。
【0084】
図17は、基本ビデオストリームおよび所定数の拡張ビデオストリームが1つのビデオエレメンタリストリームに挿入される場合(Single PID)におけるストリーム内の符号化パケット順を示している。この例は、拡張ビデオストリームが1つである場合を示している。なお、詳細は後述するが、識別情報「EHF」は、基本ビデオストリームに、SEIメッセージとして挿入される。
【0085】
図18は、基本ビデオストリームおよび所定数の拡張ビデオストリームの各ビデオストリームがそれぞれ1つのビデオエレメンタリストリームに挿入される場合(Multiple PID)における各ストリーム内の符号化パケット順を示している。この例は、拡張ビデオストリームが1つである場合を示している。
【0086】
図16に戻って、グラフィクスデータ出力部113は、画像に重畳するグラフィクス(字幕としてのサブタイトルも含む)のデータを出力する。グラフィクスエンコーダ114は、グラフィクスデータ出力部113から出力されたグラフィクスデータを含むグラフィクスストリーム(グラフィクスエレメンタリストリーム)を生成する。ここで、グラフィクスは、重畳情報を構成し、例えば、ロゴ、字幕などである。
【0087】
グラフィクスデータは、主にはビットマップデータである。このグラフィクスデータには、画像上の重畳位置を示すオフセット情報が付加されている。このオフセット情報は、例えば、画像の左上の原点から、グラフィクスの重畳位置の左上の画素までの垂直方向、水平方向のオフセット値を示す。なお、字幕データをビットマップデータとして伝送する規格は、例えば、ヨーロッパのデジタル放送規格であるDVBで「DVB_Subtitling」として規格化され、運用されている。
【0088】
音声データ出力部115は、画像データに対応した音声データを出力する。この音声データ出力部115は、例えば、マイクロホン、あるいは記憶媒体から音声データを読み出して出力する音声データ読み出し部などにより構成される。オーディオエンコーダ116は、音声データ出力部115から出力される音声データに対して、MPEG−2 Audio、AAC等の符号化を施し、オーディオストリーム(オーディオエレメンタリストリーム)を生成する。
【0089】
マルチプレクサ117は、ビデオエンコーダ112、グラフィクスエンコーダ114およびオーディオエンコーダ116で生成された各エレメンタリストリームをパケット化して多重し、トランスポートストリームTSを生成する。この場合、それぞれのPES(Packetized Elementary Stream)のヘッダには、受信側における同期再生のために、PTS(Presentation Time Stamp)が挿入される。
【0090】
マルチプレクサ117は、トランスポートストリームTSのレイヤに、第1の送信モードにあるか第2の送信モードにあるかを識別するための識別情報を挿入する。ここでは、この識別情報は、第1の送信モードであることを示す。この識別情報は、例えば、トランスポートストリームTSに含まれるプログラム・マップ・テーブル(PMT)のビデオエレメンタリ・ループ(Video ES loop)の配下に挿入される。
【0091】
また、マルチプレクサ117は、トランスポートストリームTSのレイヤに、1つまたは複数のビデオストリーム(サブストリーム)を挿入するビデオエレメンタリストリームの個数を識別するための識別情報を挿入する。ここでは、この識別情報は、「1」または「拡張ビデオストリームの個数+1」を示す。この識別情報は、例えば、トランスポートストリームTSに含まれるプログラム・マップ・テーブル(PMT)のプログラム・ループ(Program_loop)の配下に挿入される。
【0092】
次に、第2の送信モードにある場合について説明する。画像データ出力部111は、従来画像、例えばHD画像の画像データを出力する。ビデオエンコーダ112は、画像データ出力部111から出力される画像データに対して、MPEG4−AVC、MPEG2video等の符号化を施し、基本ビデオストリーム(サブストリーム)を生成する。そして、ビデオエンコーダ112は、後段に備えるストリームフォーマッタ(図示せず)により、基本ビデオストリームが挿入された1つのビデオエレメンタリストリームを生成する。
【0093】
ビデオエンコーダ112は、上述の「方法1」、あるいは「方法3」を採用する場合には、基本ビデオストリームに、第2の送信モードであることを示す識別情報「BCF」を挿入する。
【0094】
詳細説明は省略するが、グラフィクスデータ出力部113、グラフィクスエンコーダ114、音声データ出力部115およびオーディオエンコーダ116に関しては、第1の送信モードにある場合と同様である。
【0095】
マルチプレクサ117は、ビデオエンコーダ112、グラフィクスエンコーダ114およびオーディオエンコーダ116で生成された各エレメンタリストリームをパケット化して多重し、トランスポートストリームTSを生成する。この場合、それぞれのPES(Packetized Elementary Stream)のヘッダには、受信側における同期再生のために、PTS(Presentation Time Stamp)が挿入される。
【0096】
マルチプレクサ117は、トランスポートストリームTSのレイヤに、第1の送信モードにあるか第2の送信モードにあるかを識別するための識別情報を挿入する。ここでは、この識別情報は、第2の送信モードであることを示す。この識別情報は、例えば、トランスポートストリームTSに含まれるプログラム・マップ・テーブル(PMT)のビデオエレメンタリ・ループ(Video ES loop)の配下に挿入される。
【0097】
また、マルチプレクサ117は、トランスポートストリームTSのレイヤに、1つまたは複数のビデオストリーム(サブストリーム)を挿入するビデオエレメンタリストリームの個数を識別するための識別情報を挿入する。ここでは、この識別情報は、「1」を示す。この識別情報は、例えば、トランスポートストリームTSに含まれるプログラム・マップ・テーブル(PMT)のプログラム・ループ(Program_loop)の配下に挿入される。
【0098】
図16に示す送信データ生成部110の動作を簡単に説明する。最初に、第1の送信モードにある場合について説明する。画像データ出力部111から出力される、空間的あるいは時間的な超高解像度画像の画像データは、ビデオエンコーダ112に供給される。
【0099】
このビデオエンコーダ112では、その画像データに対してスケーラブル符号化の処理が施され、最下位階層の画像データを含む基本ビデオストリーム(サブストリーム)と、最下位層以外の階層の画像データをそれぞれ含む所定数の拡張ビデオストリーム(サブストリーム)が生成される。そして、ビデオエンコーダ112では、基本ビデオストリームおよび所定数の拡張ビデオストリームが挿入された1つまたは複数のビデオエレメンタリストリームが生成される。このビデオエレメンタリストリームは、マルチプレクサ117に供給される。また、このビデオエンコーダ112では、上述の「方法1」、あるいは「方法2」を採用する場合には、基本ビデオストリームに、第1の送信モードであることを示す識別情報「EHF」が挿入される(
図13、
図14参照)。
【0100】
また、グラフィクスデータ出力部113から出力されるグラフィクスデータ(サブタイトルデータも含む)は、グラフィクスエンコーダ114に供給される。このグラフィクスエンコーダ114では、グラフィクスデータを含むグラフィクスストリーム(グラフィクスエレメンタリストリーム)が生成される。このグラフィクスストリームは、マルチプレクサ115に供給される。
【0101】
また、音声データ出力部115から出力される音声データは、オーディオエンコーダ116に供給される。このオーディオエンコーダ116では、音声データに対して、MPEG−2 Audio、AAC等の符号化が施され、オーディオストリーム(オーディオエレメンタリストリーム)が生成される。このオーディオストリームは、マルチプレクサ117に供給される。
【0102】
マルチプレクサ117では、各エンコーダから供給されるエレメンタリストリームがパケット化されて多重され、トランスポートストリームTSが生成される。この場合、それぞれのPESヘッダには、受信側における同期再生のために、PTSが挿入される。また、マルチプレクサ117では、PMTのビデオエレメンタリ・ループ(Video ES loop)の配下に、第1の送信モードにあるか第2の送信モードにあるかを識別するための識別情報が挿入される。また、マルチプレクサ117では、PMTのプログラム・ループの配下に、ビデオエレメンタリストリームの個数を識別するための識別情報が挿入される。
【0103】
次に、第2の送信モードにある場合について説明する。画像データ出力部111から出力される、従来画像、例えばHD画像の画像データは、ビデオエンコーダ112に供給される。このビデオエンコーダ112では、その画像データに対して、MPEG4−AVC、MPEG2video等の符号化が施され、基本ビデオストリーム(サブストリーム)が生成される。そして、このビデオエンコーダ112では、基本ビデオストリームが挿入された1つのビデオエレメンタリストリームが生成される。また、このビデオエンコーダ112では、上述の「方法1」、あるいは「方法3」を採用する場合には、基本ビデオストリームに、第2の送信モードであることを示す識別情報「BCF」が挿入される(
図13、
図15参照)。
【0104】
マルチプレクサ117では、ビデオエンコーダ112、グラフィクスエンコーダ114およびオーディオエンコーダ116で生成された各エレメンタリストリームがパケット化されて多重され、トランスポートストリームTSが生成される。この場合、それぞれのPESヘッダには、受信側における同期再生のために、PTSが挿入される。また、マルチプレクサ117では、例えば、PMTのビデオエレメンタリ・ループ(Video ES loop)の配下に、第1の送信モードにあるか第2の送信モードにあるかを識別するための識別情報が挿入される。また、マルチプレクサ117では、例えば、PMTのプログラム・ループの配下に、ビデオエレメンタリストリームの個数を識別するための識別情報が挿入される。
【0105】
[各識別情報の構造とTS構成]
上述したように、ビデオストリームに、第1の送信モードと第2の送信モードとを識別するための識別情報(「EHF」、「BCF」)が挿入される。例えば、符号化方式がMPEG4−AVCである場合、または、HEVCのような、NALパケットなどの符号化構造が似通っている符号化方式である場合にも、この識別情報は、アクセスユニット(AU)の“SEIs”の部分に、SEIメッセージ(Enhancement scalability SEI message)として挿入される。
【0106】
図19(a)は、GOP(Group Of Pictures)の先頭のアクセスユニットを示しており、
図19(b)は、GOPの先頭以外のアクセスユニットを示している。識別情報(「EHF」、「BCF」)がGOP単位で挿入される場合、GOPの先頭のアクセスユニットにのみ「Enhancement scalability SEI message」が挿入される。なお、この図において、「Enhancement scalability SEI message」以外のSEIメッセージは、上述の
図17、
図18において、「従来SEI」と記載されている部分に相当する。
【0107】
図20(a)は、「Enhancement scalability SEI message」の構造例(Syntax)を示している。「uuid_iso_iec_11578」は、“ISO/IEC 11578:1996 AnnexA.”で示されるUUID値をもつ。「user_data_payload_byte」のフィールドに、「userdata_for_enhancement_scalability_data()」が挿入される。
図20(b)は、「userdata_for_enhancement_scalability_data()」の構造例(Syntax)を示している。この中に、エンハンスメント・スケーラビリティ・データ(enhancement_scalability_data())が挿入される。「userdata_id」は、符号なし16ビットで示されるエンハンスメント・スケーラビリティ・データの識別子である。
【0108】
図21は、エンハンスメント・スケーラビリティ・データ(enhancement_scalability_data())の構造例(Syntax)を示している。また、
図22は、その構造例における主要な情報の内容(Semantics)を示している。
【0109】
「enhancement_scalability_type」の2ビットフィールドは、スケーラビリティ拡張のタイプを示す。例えば、“00”はスケーラビリティでないことを示し、“01”は空間解像度スケーラビリティであることを示し、“10”は時間解像度スケーラビリティであることを示す。第1の送信モードであることを示す識別情報「EHF」の場合、この2ビットフィールドは、例えば、“01”あるいは“10”となる。また、第2の送信モードであることを示す識別情報「BCF」の場合、この2ビットフィールドは“00”となる。そのため、この2ビットフィールドにより、第1の送信モードにあるか第2の送信モードにあるかを識別することが可能となる。
【0110】
「number_of_enhanced_streams」の3ビットフィールドは、拡張ビデオストリームの数(個数)を示す。例えば、“000”は0ストリームを示し、“001”は1ストリームを示し、“010”は2ストリームを示し、“011”は3ストリームを示す。第1の送信モードであることを示す識別情報「EHF」の場合、この3ビットフィールドは1ストリーム以上を示すものとなる。一方、第2の送信モードであることを示す識別情報「BCF」の場合、この3ビットフィールドは0ストリームを示すものとなる。
【0111】
「enhancement_scalability_type」の2ビットフィールドが空間解像度スケーラビリティを示すとき、拡張ビデオストリームの数(個数)分だけ、「spatial_scaling_ratio」の3ビットフィールドが存在する。この3ビットフィールドは、一段上の拡張レイヤ(enhancement layer)のデコード後のピクチャ(画像)との合成を行う際の、空間的スケーリング比を示すもので、ローワーレーヤー(lower layer)のデコード後のピクチャをスケーリングする水平画素比率、そして垂直画素比率の組み合わせを表す(
図6参照)。
【0112】
例えば、“000”はスケーリングしないことを示す。“001”は水平・垂直共に、アップスケーリング比が50%(3/2倍にする)であることを示す。“010”は水平・垂直共に、アップスケーリング比が100%(2倍にする)であることを示す。さらに、“011”は水平・垂直共に、アップスケーリング比が150%(5/2倍にする)であることを示す。
【0113】
また、「enhancement_scalability_type」の2ビットフィールドが時間解像度スケーラビリティを示すとき、拡張ビデオストリームの数(個数)分だけ、「temporal_scaling_ratio」の3ビットフィールドが存在する。この3ビットフィールドは、一段上の拡張層(enhancement layer)のデコード後のピクチャとの合成を行う際の、時間的スケーリング比を示すもので、ローワーレーヤー(lower layer)のデコード後のピクチャ(画像)の間に表示させる拡張層(enhanced layer)のピクチャの数を示す(
図10参照)。
【0114】
例えば、“000”は拡張層のピクチャ挿入がないことを示す。“001”は拡張層のピクチャ挿入が1ピクチャであることを示し、“010”は拡張層のピクチャ挿入が2ピクチャであることを示し、“011”は拡張層のピクチャ挿入が3ピクチャであることを示す。
【0115】
また、上述したように、例えば、トランスポートストリームTSのプログラム・マップ・テーブル(PMT)のビデオエレメンタリ・ループ(Video ES loop)の配下に、第1の送信モードにあるか第2の送信モードにあるかを識別するための識別情報が挿入される。
図23は、この識別情報としてのスケーラブル・エンハンスメント・デスクリプタ(Scalable_enhancement_descriptor)の構造例(Syntax)を示している。また、
図24は、その構造例における主要な情報の内容(Semantics)を示している。
【0116】
このスケーラブル・エンハンスメント・デスクリプタは、例えば、第1の送信モードにある場合にのみ挿入される。そのため、このデスクリプタの存在により、トランスポートストリームTSのレイヤにおいて第1の送信モードあることの識別が可能となり、逆に、このデスクリプタの非存在により、トランスポートストリームTSのレイヤにおいて第2の送信モードあることの識別が可能となる。
【0117】
「scalable_enhancement_tag」の8ビットフィールドは、デスクリプタタイプを示し、ここでは、スケーラブル・エンハンスメント・デスクリプタであることを示す。「scalable_enhancement_length」の8ビットフィールドは、デスクリプタの長さ(サイズ)を示し、デスクリプタの長さとして以降のバイト数を示す。
【0118】
「Scalable_enhancement_type」の2ビットフィールドは、スケーラビリティ拡張のタイプを示す。例えば、“01”は空間解像度スケーラビリティであることを示し、“10”は時間解像度スケーラビリティであることを示す。
【0119】
「stream_delivery_type」の1ビットフィールドは、基本、拡張のビデオストリームが供給されるビデオエレメンタリストリーム構成を示す。“1”は各ビデオストリームが1つのビデオエレメンタリストリームで供給されることを示し、“0”は各ビデオストリームが複数のビデオエレメンタリストリームで供給されることを示す。
【0120】
「number_of_enhanced_streams」の3ビットフィールドは、拡張ビデオストリームの数(個数)を示す。例えば、“000”は0ストリームを示し、“001”は1ストリームを示し、“010”は2ストリームを示し、“011”は3ストリームを示す。
【0121】
また、上述したように、例えば、トランスポートストリームTSのプログラム・マップ・テーブル(PMT)のプログラム・ループ(Program_loop)の配下に、1つまたは複数のビデオストリーム(サブストリーム)を挿入するビデオエレメンタリストリームの個数を識別するための識別情報が挿入される。
図25(a)は、この識別情報としてのマルチプル・ストリーム・デスクリプタ(Multiple_stream_descriptor)の構造例(Syntax)を示している。
【0122】
「multiple_stream_tag」の8ビットフィールドは、デスクリプタタイプを示し、ここでは、マルチプル・ストリーム・デスクリプタであることを示す。「multiple_stream_length」の8ビットフィールドは、デスクリプタの長さ(サイズ)を示し、デスクリプタの長さとして以降のバイト数を示す。
【0123】
「number_of_video_streams」の3ビットフィールドは、ビデオエレメンタリストリームの個数を示す。例えば、
図25(b)に示すように、“001”は1ストリームを示し、“010”は2ストリームを示し、“011”は3ストリームを示し、“100”は4ストリームを示す。第1の送信モードである場合、この3ビットフィールドは1ストリーム以上を示すものとなる。一方、第2の送信モードである場合、この3ビットフィールドは1ストリームのみを示すものとなる。
【0124】
図26は、トランスポートストリームTSの構成例を示している。この例は、図面の簡単化のために、オーディオおよびグラフィクスに関する部分については、その図示を省略している。この例は、基本ビデオストリームのみ、あるいは基本ビデオストリームおよび所定数の拡張ビデオストリームが1つのビデオエレメンタリストリームに挿入されて送信される場合(Single PID)の例を示している。すなわち、この1つのビデオエレメントストリームには、第1の送信モードの場合には基本ビデオストリームと所定数の拡張ビデオストリームが挿入されており、第2の送信モードの場合には基本ビデオストリームのみが挿入されている。
【0125】
トランスポートストリームTSには、1つのビデオエレメンタリストリームのPESパケット「PID1:video PES1」が含まれている。このビデオエレメンタリストリームに挿入される基本ビデオストリーム(サブストリーム)に、第1の送信モードと第2の送信モードとを識別するための識別情報(「EHF」、「BCF」)が、SEIメッセージ(Enhancement scalability SEI message)として挿入されている(
図21参照)。
【0126】
また、トランスポートストリームTSには、PSI(Program Specific Information)として、PMT(Program Map Table)が含まれている。このPSIは、トランスポートストリームに含まれる各エレメンタリストリームがどのプログラムに属しているかを記した情報である。
【0127】
PMTには、各エレメンタリストリームに関連した情報を持つエレメンタリ・ループが存在する。この構成例では、ビデオエレメンタリ・ループ(Video ES loop)が存在する。このビデオエレメンタリ・ループには、上述の1つのビデオエレメンタリストリームに対応して、ストリームタイプ、パケット識別子(PID)等の情報が配置されると共に、そのビデオエレメンタリストリームに関連する情報を記述するデスクリプタも配置される。
【0128】
このPMTのビデオエレメンタリ・ループ(Video ES loop)の配下に、上述の1つのビデオエレメンタリストリームに関連して、スケーラブル・エンハンスメント・デスクリプタ(Scalable_enhancement_descriptor)が挿入される(
図23参照)。また、PMTのプログラム・ループ(Program loop)の配下に、マルチプル・ストリーム・デスクリプタ(Multiple_stream_descriptor)が挿入される(
図25参照)。なお、スケーラブル・エンハンスメント・デスクリプタは、上述したように、例えば、第1の送信モードにある場合のみ挿入されるものである。
【0129】
図27も、トランスポートストリームTSの構成例を示している。この例も、図面の簡単化のために、オーディオおよびグラフィクスに関する部分については、その図示を省略している。この例は、基本ビデオストリームおよび所定数の拡張ビデオストリームがそれぞれ別個のビデオエレメンタリストリームに挿入されて送信される場合(Multiple PID)の例を示している。なお、この例は、拡張ビデオストリームが2個の場合の例を示している。
【0130】
この構成例では、基本ビデオストリーム(サブストリーム)が挿入されたビデオエレメンタリストリームのPESパケット「PID1:video PES1」が含まれている。この基本ビデオストリームに、第1の送信モードと第2の送信モードとを識別するための識別情報(「EHF」、「BCF」)が、SEIメッセージ(Enhancement scalability SEI message)として挿入されている(
図21参照)。
【0131】
また、この構成例では、第1の拡張ビデオストリーム(サブストリーム)が挿入されたビデオエレメンタリストリームのPESパケット「PID2:video PES2」と、第2の拡張ビデオストリーム(サブストリーム)が挿入されたビデオエレメンタリストリームのPESパケット「PID3:video PES3」が含まれている。
【0132】
また、トランスポートストリームTSには、PSI(Program Specific Information)として、PMT(Program Map Table)が含まれている。このPSIは、トランスポートストリームに含まれる各エレメンタリストリームがどのプログラムに属しているかを記した情報である。
【0133】
PMTには、各エレメンタリストリームに関連した情報を持つエレメンタリ・ループが存在する。この構成例では、ビデオエレメンタリ・ループ(Video ES loop)が存在する。このビデオエレメンタリ・ループには、ビデオエレメンタリストリーム毎に、ストリームタイプ、パケット識別子(PID)等の情報が配置されると共に、そのビデオエレメンタリストリームに関連する情報を記述するデスクリプタも配置される。
【0134】
このPMTのビデオエレメンタリ・ループ(Video ES loop)の配下に、上述の各ビデオエレメンタリストリームにそれぞれ関連して、同一内容のスケーラブル・エンハンスメント・デスクリプタ(Scalable_enhancement_descriptor)が挿入される(
図23参照)。なお、基本ビデオストリームが挿入されるビデオエレメンタリストリームに関連してのみ、スケーラブル・エンハンスメント・デスクリプタ(Scalable_enhancement_descriptor)が挿入されてもよい。また、PMTのプログラム・ループ(Program loop)の配下に、マルチプル・ストリーム・デスクリプタ(Multiple_stream_descriptor)が挿入される(
図25参照)。なお、スケーラブル・エンハンスメント・デスクリプタは、上述したように、例えば、第1の送信モードにある場合のみ挿入されるものである。
【0135】
「受信機の構成例」
図28は、受信機200の構成例を示している。この受信機200は、CPU201と、フラッシュROM202と、DRAM203と、内部バス204と、リモートコントロール受信部(RC受信部)205と、リモートコントロール送信機(RC送信機)206を有している。また、この受信機200は、アンテナ端子211と、デジタルチューナ212と、トランスポートストリームバッファ(TSバッファ)213と、デマルチプレクサ214を有している。
【0136】
また、この受信機200は、コーデッドバッファ215と、ビデオデコーダ216と、基本ストリームデコーデッドバッファ217と、拡張ストリームデコーデッドバッファ218と、合成処理部219と、ビデオRAM220と、解像度アップ処理部221と、重畳部2222を有している。また、この受信機200は、コーデッドバッファ231と、グラフィクスデコーダ232と、ピクセルバッファ233と、スケーラ234と、コーデッドバッファ241と、オーディオデコーダ242と、チャネルミキシング部243を有している。
【0137】
CPU201は、受信機200の各部の動作を制御する。フラッシュROM202は、制御ソフトウェアの格納およびデータの保管を行う。DRAM203は、CPU201のワークエリアを構成する。CPU201は、フラッシュROM202から読み出したソフトウェアやデータをDRAM203上に展開してソフトウェアを起動させ、受信機200の各部を制御する。RC受信部205は、RC送信機206から送信されたリモーコントロール信号(リモコンコード)を受信し、CPU201に供給する。CPU201は、このリモコンコードに基づいて、受信機200の各部を制御する。CPU201、フラッシュROM202およびDRAM203は、内部バス204に接続されている。
【0138】
アンテナ端子211は、受信アンテナ(図示せず)で受信されたテレビ放送信号を入力する端子である。デジタルチューナ212は、アンテナ端子211に入力されたテレビ放送信号を処理して、ユーザの選択チャネルに対応した所定のトランスポートストリーム(ビットストリームデータ)TSを出力する。トランスポートストリームバッファ(TSバッファ)213は、デジタルチューナ212から出力されたトランスポートストリームTSを一時的に蓄積する。
【0139】
このトランスポートストリームTSには、1つまたは複数のビデオエレメンタリストリームと、グラフィクスエレメンタリストリームと、オーディオエレメンタリストリームが含まれている。そして、この1つまたは複数のビデオエレメンタリストリームには、第1の送信モードにある場合および第2の送信モードにある場合において、以下のサブストリームが挿入されている。
【0140】
すなわち、第1の送信モードにある場合には、基本ビデオストリームと、所定数の拡張ビデオストリームが挿入されている。この場合、基本ビデオストリームには、スケーラブル符号化画像データ(空間的あるいは時間的な超高解像度画像の画像データ)を構成する最下位階層の画像データが含まれている。また、所定数の拡張ビデオストリームには、スケーラブル符号化画像データを構成する最下位階層以外の階層の画像データがそれぞれ含まれている。また、このトランスポートストリームTSには、第2の送信モードにある場合、基本ビデオストリームのみが挿入されている。この場合、基本ビデオストリームには、従来画像(例えば、HD解像度、25fps、30fps画像など)の画像データが基本画像データとして含まれている。
【0141】
また、基本ビデオストリームには、第1の送信モードと第2の送信モードとを識別するための識別情報(「EHF」、「BCF」)としてのSEIメッセージ(Enhancement scalability SEI message)が挿入されている(
図21参照)。また、トランスポートストリームTSのレイヤに、第1の送信モードにあるか第2の送信モードにあるかを識別するための識別情報として、スケーラブル・エンハンスメント・デスクリプタ(Scalable_enhancement_descriptor)が挿入されている(
図23参照)。さらに、トランスポートストリームTSのレイヤに、ビデオエレメンタリストリームの個数を識別するための識別情報として、マルチプル・ストリーム・デスクリプタ(Multiple_stream_descriptor)が挿入されている(
図25参照)。
【0142】
デマルチプレクサ214は、TSバッファ213に一時的に蓄積されたトランスポートストリームTSから、ビデオ、グラフィクスおよびオーディオの各エレメンタリストリームを抽出する。また、デマルチプレクサ214は、このトランスポートストリームTSから、上述したスケーラブル・エンハンスメント・デスクリプタと、マルチプル・ストリーム・デスクリプタとを抽出し、CPU201に送る。
【0143】
CPU201は、これらのデスクリプタに含まれる情報に基づいて、受信機200におけるデコード等の処理を制御する。例えば、マルチプル・ストリーム・デスクリプタに含まれるビデオエレメンタリストリームの個数だけ、ビデオエレメンタリ・ループ(Video ES loop)の配下のスケーラブル・エンハンスメント・デスクリプタと、それに関連付けられるビデオエレメンタリストリーム(PESストリーム)をデコードするように制御する。
【0144】
コーデッドバッファ215は、デマルチプレクサ214で抽出される1つまたは複数のビデオエレメンタリストリームを一時的に蓄積する。ビデオデコーダ216は、CPU201の制御のもと、コーデッドバッファ215に記憶されているビデオエレメンタリストリームに挿入されている1つまたは複数のビデオストリーム(サブストリーム)を取り出してデコードする。
【0145】
第1の送信モードにある場合には、基本ビデオストリームと、所定数の拡張ビデオストリームが取り出されてデコードされる。この場合、基本ビデオストリームがデコードされることで、スケーラブル符号化画像データを構成する最下位階層の画像データ(例えば、HD解像度、25fps、30fps画像などの画像データ)が得られる。また、所定数の拡張ビデオストリームがそれぞれデコードされることでスケーラブル符号化画像データを構成する最下位階層以外の階層の画像データが得られる。また、第2の送信モードにある場合には、基本ビデオストリームのみが取り出されてデコードされる。この場合、基本ビデオストリームがデコードされることで、従来画像(例えば、HD解像度、25fps、30fps画像など)の画像データが得られる。
【0146】
また、ビデオデコーダ216は、基本ビデオストリームに挿入されているSEIメッセージ(Enhancement scalability SEI message)を抽出し、CPU201に送る。CPU201は、上述のスケーラブル・エンハンスメント・デスクリプタ存在、非存在の他に、このSEIメッセージ内のモード情報により、第1の送信モードにあるか第2の送信モードにあるかを識別し、各モードに応じた処理が行われるように、受信機200の各部を制御する。例えば、スケーラブル・エンハンスメント・デスクリプタの存在、非存在によりトランスポートストリームTSのレイヤでモード切り替わりが識別された場合、その後のSEIメッセージ内のモード情報でそのモード切り替わりが識別された時点で、処理の切り替えが行われる。
【0147】
基本ストリームデコーデッドバッファ217は、ビデオデコーダ216で基本ビデオストリームがデコードされて得られた画像データを一時的に蓄積する。この画像データは、第1の送信モードにある場合にはスケーラブル符号化画像データを構成する最下位階層の画像データであり、第2の送信モードにある場合には従来画像の画像データである。拡張ストリームデコーデッドバッファ218は、ビデオデコーダ216で所定数の拡張ビデオストリームがデコードされて得られた各画像データを一時的に蓄積する。この各画像データは、第1の送信モードにある場合のみ得られ、スケーラブル符号化画像データを構成する最下位階層以外の階層の画像データである。
【0148】
合成処理部219は、第1の送信モードにある場合のみ処理を行う。この合成処理部219は、基本ストリームデコーデッドバッファ217に記憶されている最下位階層の画像データと、拡張ストリームデコーデッドバッファ218に記憶されている最下位階層以外の階層の画像データとの合成処理を行って、超高解像度画像の表示用画像データVaを生成する(
図6、
図10参照)。この場合、合成処理部219では、スケーラビリティ拡張のタイプに応じて、SEIメッセージ(Enhancement scalability SEI message)に含まれるスケーリング比などの情報を参照して、空間解像度スケーラビリティあるいは時間解像度スケーラビリティの合成処理を行う。
【0149】
解像度アップ処理部221は、第2の送信モードにある場合のみ処理を行う。この解像度アップ処理部221は、基本ストリームデコーデッドバッファ217に記憶されている従来画像の画像データに対して、解像度アップ処理を行って、上述の超高解像度画像の表示用画像データVaの解像度と同等の解像度を持つ表示用画像データVbを生成する。ここで、空間解像度スケーラビリティの場合には空間解像度のアップ処理が行われ、時間解像度スケーラビリティの場合にはフレーム周波数のアップ処理が行われる。
【0150】
ビデオRAM220は、第1の送信モードにある場合には、合成処理部219で生成された画像データVaを一時的に蓄積する。また、ビデオRAM220は、第2の送信モードにある場合には、解像度アップ処理部221で生成された画像データVbを一時的に蓄積する。
【0151】
コーデッドバッファ231は、デマルチプレクサ214で抽出されるグラフィクスストリームを一時的に蓄積する。グラフィクスデコーダ232は、上述の送信データ生成部110のグラフィクスエンコーダ114(
図16参照)とは逆の処理を行う。すなわち、グラフィクスデコーダ232は、コーデッドバッファ231に記憶されているグラフィクスストリームの復号化処理を行って、復号化されたグラフィクスデータ(サブタイトルデータを含む)を得る。また、グラフィクスデコーダ232は、このグラフィクスデータに基づいて、画像データに重畳するグラフィクスのビットマップデータを発生する。
【0152】
ピクセルバッファ233は、グラフィクスデコーダ232で発生されるグラフィクスのビットマップデータを一時的に蓄積する。スケーラ234は、ピクセルバッファ233に蓄積されているグラフィクスのビットマップデータのサイズを、表示用画像データのサイズに対応するように調整する。重畳部222は、ビデオRAM220で記憶されている表示用画像データVa,Vbに、スケーリング後のグラフィクスのビットマップデータを重畳して、最終的な表示用画像データを得る。
【0153】
コーデッドバッファ241は、デマルチプレクサ214で抽出されるオーディオストリームを一時的に蓄積する。オーディオデコーダ242は、上述の送信データ生成部110のオーディオエンコーダ116(
図16参照)とは逆の処理を行う。すなわち、オーディオデコーダ242は、コーデッドバッファ241に記憶されているオーディオスストリームの復号化処理を行って、復号化された音声データを得る。チャネルミキシング部243は、オーディオデコーダ242で得られる音声データに対して、例えば5.1chサラウンド等を実現するための各チャネルの音声データを得る。
【0154】
なお、基本ストリームデコーデッドバッファ217および拡張ビデオストリームデコーデッドバッファ218からの画像データの読み出しと、ピクセルバッファ233からのグラフィクスのビットマップデータの読み出しとは、PTSに基づいて行われ、転送同期が取られる。
【0155】
受信機200の動作を説明する。最初に、第1の送信モードにある場合について説明する。アンテナ端子211に入力されたテレビ放送信号はデジタルチューナ212に供給される。このデジタルチューナ212では、テレビ放送信号が処理されて、ユーザの選択チャネルに対応した所定のトランスポートストリームTSが出力される。このトランスポートストリームTSは、TSバッファ213に一時的に蓄積される。
【0156】
このトランスポートストリームTSには、1つまたは複数のビデオエレメンタリストリームと、グラフィクスエレメンタリストリームと、オーディオエレメンタリストリームが含まれている。そして、この1つまたは複数のビデオエレメンタリストリームには、基本ビデオストリームと、所定数の拡張ビデオストリームが挿入されている。
【0157】
デマルチプレクサ214では、TSバッファ213に一時的に蓄積されたトランスポートストリームTSから、ビデオ、グラフィクスおよびオーディオの各エレメンタリストリームが抽出される。また、デマルチプレクサ214では、このトランスポートストリームTSから、スケーラブル・エンハンスメント・デスクリプタ(Scalable_enhancement_descriptor)と、マルチプル・ストリーム・デスクリプタ(Multiple_stream_descriptor)とが抽出され、CPU201に送られる。CPU201では、これらのデスクリプタに含まれる情報に基づいて、受信機200におけるデコード等の処理を制御することが行われる。
【0158】
デマルチプレクサ214で抽出される1つまたは複数のビデオエレメンタリストリームは、コーデッドバッファ215に供給されて一時的に蓄積される。ビデオデコーダ216では、CPU201の制御のもと、コーデッドバッファ215に記憶されているビデオエレメンタリストリームに挿入されている1つまたは複数のビデオストリーム(サブストリーム)が取り出されてデコードされる。
【0159】
この場合、基本ビデオストリームと、所定数の拡張ビデオストリームが取り出されてデコードされる。基本ビデオストリームがデコードされることで、スケーラブル符号化画像データを構成する最下位階層の画像データ(例えば、HD解像度、25fps、30fps画像など)が得られる。また、所定数の拡張ビデオストリームがそれぞれデコードされることでスケーラブル符号化画像データを構成する最下位階層以外の階層の画像データが得られる。
【0160】
また、ビデオデコーダ216では、基本ビデオストリームに挿入されているSEIメッセージ(Enhancement scalability SEI message)が抽出され、CPU201に送られる。CPU201では、上述のスケーラブル・エンハンスメント・デスクリプタの存在の他に、このSEIメッセージ内のモード情報により、第1の送信モードにあるか第2の送信モードにあるかが識別される。そして、この場合においては第1の送信モードであることが識別され、この第1の送信モードに応じた処理が行われるように受信機200の各部を制御することが行われる。
【0161】
ビデオデコーダ216で得られたスケーラブル符号化画像データを構成する最下位階層の画像データは、基本ストリームデコーデッドバッファ217に一時的に蓄積される。また、ビデオデコーダ216で得られたスケーラブル符号化画像データを構成する最下位階層以外の階層の画像データは、拡張ストリームデコーデッドバッファ218に一時的に蓄積される。
【0162】
合成処理部219では、基本ストリームデコーデッドバッファ217に記憶されている最下位階層の画像データと、拡張ストリームデコーデッドバッファ218に記憶されている最下位階層以外の階層の画像データとの合成処理が行われる。そして、この合成処理部219では、超高解像度画像の表示用画像データVaが生成される。この表示用画像データVaは、ビデオRAM220に一時的に蓄積される。
【0163】
また、デマルチプレクサ214で抽出されるグラフィクスストリームは、コーデッドバッファ231に供給されて一時的に蓄積される。グラフィクスデコーダ232では、コーデッドバッファ231に記憶されているグラフィクスストリームの復号化処理が行われて、復号化されたグラフィクスデータ(サブタイトルデータを含む)が得られる。また、このグラフィクスデコーダ232では、このグラフィクスデータに基づいて、画像データに重畳するグラフィクスのビットマップデータが発生される。
【0164】
グラフィクスデコーダ232で発生されるグラフィクスのビットマップデータは、ピクセルバッファ233に供給されて一時的に蓄積される。スケーラ234では、ピクセルバッファ233に蓄積されているグラフィクスのビットマップデータのサイズが、表示用画像データVaのサイズに対応するように調整される。重畳部222では、ビデオRAM220で記憶されている表示用画像データVaに、スケーリング後のグラフィクスのビットマップデータが重畳されて、最終的な表示用画像データが得られる。この表示用画像データがディスプレイに供給されることで、空間的あるいは時間的な超高解像度画像の表示が行われる。
【0165】
また、デマルチプレクサ214で抽出されるオーディオストリームは、コーデッドバッファ241に供給されて一時的に蓄積される。オーディオデコーダ242では、コーデッドバッファ241に記憶されているオーディオストリームの復号化処理が行われて、復号化された音声データが得られ。この音声データはチャネルミキシング部243に供給される。チャネルミキシング部243では、音声データに対して、例えば5.1chサラウンド等を実現するための各チャネルの音声データが生成される。この音声データは例えばスピーカに供給され、画像表示に合わせた音声出力がなされる。
【0166】
次に、第2の送信モードにある場合について説明する。アンテナ端子211に入力されたテレビ放送信号はデジタルチューナ212に供給される。このデジタルチューナ212では、テレビ放送信号が処理されて、ユーザの選択チャネルに対応した所定のトランスポートストリームTSが出力される。このトランスポートストリームTSは、TSバッファ213に一時的に蓄積される。
【0167】
このトランスポートストリームTSには、1つのビデオエレメンタリストリームと、グラフィクスエレメンタリストリームと、オーディオエレメンタリストリームが含まれている。そして、この1つのビデオエレメンタリストリームには、基本ビデオストリームが挿入されている。
【0168】
デマルチプレクサ214では、TSバッファ213に一時的に蓄積されたトランスポートストリームTSから、ビデオ、グラフィクスおよびオーディオの各エレメンタリストリームが抽出される。また、デマルチプレクサ214では、このトランスポートストリームTSから、マルチプル・ストリーム・デスクリプタ(Multiple_stream_descriptor)が抽出され、CPU201に送られる。CPU201では、このデスクリプタに含まれる情報に基づいて、受信機200におけるデコード等の処理を制御することが行われる。
【0169】
デマルチプレクサ214で抽出される1つのビデオエレメンタリストリームは、コーデッドバッファ215に供給されて一時的に蓄積される。ビデオデコーダ216では、CPU201の制御のもと、コーデッドバッファ215に記憶されているビデオエレメンタリストリームに挿入されている基本ビデオストリーム(サブストリーム)が取り出されてデコードされる。このデコードにより、従来画像(例えば、HD解像度、25fps、30fps画像など)の画像データが得られる。この画像データは、基本ストリームデコーデッドバッファ217に一時的に蓄積される。
【0170】
また、ビデオデコーダ216では、基本ビデオストリームに挿入されているSEIメッセージ(Enhancement scalability SEI message)が抽出され、CPU201に送られる。CPU201では、上述のスケーラブル・エンハンスメント・デスクリプタの非存在の他に、このSEIメッセージ内のモード情報により、第1の送信モードにあるか第2の送信モードにあるかが識別される。そして、この場合においては第2の送信モードであることが識別され、この第2の送信モードに応じた処理が行われるように受信機200の各部を制御することが行われる。
【0171】
解像度アップ処理部221では、基本ストリームデコーデッドバッファ217に記憶されている従来画像の画像データに対して、解像度アップ処理が行われ、上述の超高解像度画像の表示用画像データVaの解像度と同等の解像度を持つ表示用画像データVbが生成される。ここで、空間解像度スケーラビリティの場合には空間解像度のアップ処理が行われ、時間解像度スケーラビリティの場合にはフレーム周波数のアップ処理が行われる。
【0172】
また、デマルチプレクサ214で抽出されるグラフィクスストリームは、コーデッドバッファ231に供給されて一時的に蓄積される。グラフィクスデコーダ232では、コーデッドバッファ231に記憶されているグラフィクスストリームの復号化処理が行われて、復号化されたグラフィクスデータ(サブタイトルデータを含む)が得られる。また、このグラフィクスデコーダ232では、このグラフィクスデータに基づいて、画像データに重畳するグラフィクスのビットマップデータが発生される。
【0173】
グラフィクスデコーダ232で発生されるグラフィクスのビットマップデータは、ピクセルバッファ233に供給されて一時的に蓄積される。スケーラ234では、ピクセルバッファ233に蓄積されているグラフィクスのビットマップデータのサイズが、表示用画像データVbのサイズに対応するように調整される。重畳部222では、ビデオRAM220で記憶されている表示用画像データVbに、スケーリング後のグラフィクスのビットマップデータが重畳されて、最終的な表示用画像データが得られる。この表示用画像データがディスプレイに供給されることで、従来画像に解像度アップ処理が施された画像の表示が行われる。
【0174】
なお、音声系の動作に関しては、第1の送信モードにある場合と同様であるので、その説明は省略する。
【0175】
[高精細番組と従来番組の切り替え時の受信処理の切り替え制御]
ここで、受信機200における高精細番組と従来番組の切り替え時における受信処理の切り替えについて説明する。ここで、高精細番組は第1の送信モードで送られてくるが、従来番組は第2の送信モードで送られてくる。
【0176】
図29は、受信処理の切り替え制御の一例を示している。この例は、第1の送信モードにおいては、基本ビデオストリームと所定数の拡張ビデオストリームとが1つのビデオエレメンタリストリームに挿入されて供給されるものである。この場合、基本ビデオストリームには最下位階層(第1階層)の画像データ(HD画像データ)が含まれており、所定数の拡張ビデオストリームには最下位階層以外の階層(enhanced layer)の画像データが含まれている。なお、第2の送信モードにおいては、基本ビデオストリームが挿入された1つのビデオストリームが供給されるものである。
【0177】
トランスポートストリームTSのレイヤに挿入されているマルチプル・ストリーム・デスクリプタ(Multiple_stream_descriptor)の「number_of_video_streams」は、高精細番組(第1の送信モード)の期間および従来番組(第2の送信モード)の期間の双方で“001”とされ、いずれの期間でもビデオエレメンタリストリームの個数が1つであることが示される。
【0178】
また、高精細番組(第1の送信モード)でトランスポートストリームTSのレイヤに挿入されるスケーラブル・エンハンスメント・デスクリプタ(Scalable_enhancement_descriptor)の「scalable_enhancement_type」は、“01”とされ、空間解像度スケーラビリティあることが示される。また、このデスクリプタの「stream_delivery_type」は、“1”とされ、基本および拡張のビデオストリームが1つのビデオエレメンタリストリームで供給されることが示される。
【0179】
基本ストリームには、SEIメッセージ(Enhancement scalability SEI message)が挿入されている。高精細番組(第1の送信モード)の期間、このSEIメッセージに含まれる「enhancement_scalability_type」は空間解像度スケーラビリティあることを示す“01”であり、高精細番組(第1の送信モード)であることの識別も可能とされる。一方、従来番組(第2の送信モード)の期間、「enhancement_scalability_type」は“00”であり、従来番組(第2の送信モード)の期間であることが識別可能とされる。
【0180】
受信機200における受信処理の切り替え制御は、例えば、以下のように行われる。従来番組(第2の送信モード)から高精細番組(第1の送信モード)への受信処理の切り替えの場合、まず、スケーラブル・エンハンスメント・デスクリプタ(Scalable_enhancement_descriptor)の存在によりトランスポートストリームTSのレイヤで高精細番組(第2の送信モード)への切り替えが識別される。その後、基本ストリームに挿入されているSEIメッセージ(Enhancement scalability SEI message)の「enhancement_scalability_type」が“01”となってビデオレイヤで高精細番組(第2の送信モード)への切り替えが識別される。この識別タイミング(「Ta」で図示)で、従来番組(第2の送信モード)から高精細番組(第1の送信モード)に受信処理が切り替えられる。
【0181】
一方、高精細番組(第1の送信モード)から従来番組(第2の送信モード)への受信処理の切り替えの場合、まず、スケーラブル・エンハンスメント・デスクリプタ(Scalable_enhancement_descriptor)の非存在によりトランスポートストリームTSのレイヤで従来番組(第2の送信モード)への切り替えが識別される。その後、基本ストリームに挿入されているSEIメッセージ(Enhancement scalability SEI message)の「enhancement_scalability_type」が“00”となってビデオレイヤで従来番組(第2の送信モード)への切り替えが識別される。この識別タイミング(「Tb」で図示)で、高精細番組(第1の送信モード)から従来番組(第2の送信モード)に受信処理が切り替えられる。
【0182】
図30は、受信処理の切り替え制御の一例を示している。この例は、第1の送信モードにおいては、基本ビデオストリームと2つの拡張ビデオストリームとが3つのビデオエレメンタリストリームに挿入されて供給されるものである。この場合、基本ビデオストリームには最下位階層(第1階層)の画像データ(HD画像データ)が含まれている。また、第1の拡張ビデオストリームには第2階層の画像データ(高周波成分)が含まれており、第2の拡張ビデオストリームには第3階層の画像データ(高周波成分)が含まれている。なお、第2の送信モードにおいては、基本ビデオストリームが挿入された1つのビデオストリームが供給されるものである。
【0183】
トランスポートストリームTSのレイヤに挿入されているマルチプル・ストリーム・デスクリプタ(Multiple_stream_descriptor)の「number_of_video_streams」は、高精細番組(第1の送信モード)の期間では“011”とされ、ビデオエレメンタリストリームの個数が3つであることが示される。一方、この「number_of_video_streams」は、従来番組(第2の送信モード)の期間では“001”とされ、ビデオエレメンタリストリームの個数が1つであることが示される。
【0184】
また、高精細番組(第1の送信モード)でトランスポートストリームTSのレイヤに挿入されるスケーラブル・エンハンスメント・デスクリプタ(Scalable_enhancement_descriptor)の「scalable_enhancement_type」は、“01”とされ、空間解像度スケーラビリティあることが示される。また、このデスクリプタの「stream_delivery_type」は、“0”とされ、基本および拡張のデオストリームが複数のビデオエレメンタリストリームで供給されることが示される。
【0185】
基本ストリームには、SEIメッセージ(Enhancement scalability SEI message)が挿入されている。高精細番組(第1の送信モード)の期間、このSEIメッセージに含まれる「enhancement_scalability_type」は空間解像度スケーラビリティあることを示す“01”であり、高精細番組(第1の送信モード)であることの識別も可能とされる。一方、従来番組(第2の送信モード)の期間、「enhancement_scalability_type」は“00”であり、従来番組(第2の送信モード)の期間であることが識別可能とされる。
【0186】
詳細説明は、省略するが、この
図30に示す例においても、上述の
図29に示す例と同様に、トランスポートストリームTSのレイヤでの番組切り替えの識別と、その後のビデオレイヤでの番組切り替わり識別に基づいて、受信機200における受信処理の切り替え制御が行われる。
【0187】
上述したように、
図1に示す画像送受信システム10においては、第1の送信モードでは、スケーラブル符号化画像データを構成する最下位階層の画像データを含む基本ビデオストリームおよびスケーラブル符号化画像データを構成する最下位階層以外の階層の画像データをそれぞれ含む所定数の拡張ビデオストリームを送信し、第2の送信モードでは、基本画像データを含む基本ビデオストリームのみを送信するものである。そして、第1のモードおよび第2のモードを識別するための識別情報(「EHF」、「BCF」)をビデオストリームに挿入するものである。
【0188】
そのため、受信側では、この識別情報に基づいて、第1の送信モードであるか第2の送信モードであるかを容易に把握でき、ストリーム構成の変化、つまり、配信内容の動的な変化に的確に対応でき、正しいストリーム受信を行うことが可能となる。つまり、従来画像の画像データと、空間的あるいは時間的な超高解像度画像の画像データ(スケーラブル符号化画像データ)とが時分割的に送信される場合に、受信側において、処理の切り替えを良好に行うことができる。
【0189】
<2.変形例>
なお、上述実施の形態においては、コンテナがトランスポートストリーム(MPEG−2 TS)である例を示した。しかし、本技術は、インターネット等のネットワークを利用して受信端末に配信される構成のシステムにも同様に適用できる。インターネットの配信では、MP4やそれ以外のフォーマットのコンテナで配信されることが多い。つまり、コンテナとしては、デジタル放送規格で採用されているトランスポートストリーム(MPEG−2 TS)、インターネット配信で使用されているMP4などの種々のフォーマットのコンテナが該当する。
【0190】
また、本技術は、以下のような構成を取ることもできる。
(1)1つまたは複数のビデオストリームを送信する送信部と、
スケーラブル符号化画像データを構成する最下位階層の画像データを含む基本ビデオストリームおよび上記スケーラブル符号化画像データを構成する最下位階層以外の階層の画像データをそれぞれ含む所定数の拡張ビデオストリームを送信する第1の送信モードと、基本画像データを含む基本ビデオストリームのみを送信する第2の送信モードとを識別するための識別情報を、上記ビデオストリームに挿入する識別情報挿入部とを備える
送信装置。
(2)上記識別情報挿入部は、
上記第1の送信モードでは、上記ビデオストリームに、該第1の送信モードであることを示す識別情報を挿入し、上記第2の送信モードでは、上記ビデオストリームに、上記識別情報を挿入しない
前記(1)に記載の送信装置。
(3)上記識別情報挿入部は、
上記第1の送信モードでは、上記ビデオストリームに、該第1の送信モードであることを示す識別情報を挿入し、上記第2の送信モードでは、上記ビデオストリームに、該第2の送信モードであることを示す識別情報を挿入する
前記(1)に記載の送信装置。
(4)上記識別情報挿入部は、
上記第1の送信モードでは、上記ビデオストリームに、上記識別情報を挿入せず、上記第2の送信モードでは、上記ビデオストリームに、該第2の送信モードであることを示す識別情報を挿入する
前記(1)に記載の送信装置。
(5)上記識別情報挿入部は、
上記基本ビデオストリームに、上記識別情報を、少なくとも、番組単位、シーン単位、ピクチャグループ単位、あるいはピクチャ単位で挿入する
前記(1)から(4)のいずれかに記載の送信装置。
(6)上記送信部は、
上記第1の送信モードでは、上記基本ビデオストリームと上記所定数の拡張ビデオストリームを、1つまたは複数のビデオエレメンタリストリームに挿入して送信する
前記(1)から(5)のいずれかに記載の送信装置。
(7)上記基本ビデオストリームと上記所定数の拡張ビデオストリームを1つのビデオエレメンタリストリームに挿入して送信する場合、各ビデオストリームの間にストリーム境界を示す情報が配置される
前記(6)に記載の送信装置。
(8)上記識別情報には、上記第1の送信モードを示す場合、上記拡張ビデオストリームの個数を示す情報が含まれている
前記(1)から(7)のいずれかに記載の送信装置。
(9)上記識別情報には、上記第1の送信モードを示す場合、スケーラビリティ拡張のタイプを示す情報が含まれている
前記(1)から(8)のいずれかに記載の送信装置。
(10)上記識別情報には、上記第1の送信モードを示す場合、スケーラビリティ拡張における上位階層との合成の際のスケーリング比の情報が含まれている
前記(1)から(9)のいずれかに記載の送信装置。
(11)上記送信部は、上記1つまたは複数のビデオストリームを含む所定フォーマットのコンテナを送信し、
上記コンテナのレイヤに、上記第1の送信モードにあるか上記第2の送信モードにあるかを識別するための識別情報を挿入する識別情報挿入部をさらに備える
前記(1)から(10)のいずれかに記載の送信装置。
(12)上記識別情報には、上記第1の送信モードを示す場合、スケーラビリティ拡張のタイプを示す情報が付加されている
前記(11)に記載の送信装置。
(13)上記識別情報には、上記1つまたは複数のビデオストリームが1つのビデオエレメンタリストリームで供給されるか否かを示す情報が付加されている
前記(11)または(12)に記載の送信装置。
(14)上記識別情報には、上記第1の送信モードを示す場合、上記拡張ビデオストリームの個数を示す情報が付加されている
前記(11)から(13)のいずれかに記載の送信装置。
(15)上記送信部は、上記1つまたは複数のビデオストリームを含む所定フォーマットのコンテナを送信し、
上記コンテナのレイヤに、上記1つまたは複数のビデオストリームを挿入するビデオエレメンタリストリームの個数を識別するための識別情報を挿入する識別情報挿入部をさらに備える
前記(1)から(14)のいずれかに記載の送信装置。
(16)1つまたは複数のビデオストリームを送信するステップと、
スケーラブル符号化画像データを構成する最下位階層の画像データを含む基本ビデオストリームおよび上記スケーラブル符号化画像データを構成する最下位階層以外の階層の画像データをそれぞれ含む所定数の拡張ビデオストリームを送信する第1の送信モードと、基本画像データを含む基本ビデオストリームのみを送信する第2の送信モードとを識別するための識別情報を、上記基本ビデオストリームに挿入するステップとを備える
送信方法。
(17)1つまたは複数のビデオストリームを受信する受信部と、
上記ビデオストリームに挿入されている識別情報に基づいて、スケーラブル符号化画像データを構成する最下位階層の画像データを含む基本ビデオストリームおよび上記スケーラブル符号化画像データを構成する最下位階層以外の階層の画像データをそれぞれ含む所定数の拡張ビデオストリームを送信する第1の送信モードであるか、基本画像データを含む基本ビデオストリームのみを送信する第2の送信モードであるかを識別する送信モード識別部と、
上記受信されたビデオストリームに対して、上記モード識別結果に基づき、各モードに応じた処理を行って、画像表示のための画像データを得る処理部とを備える
受信装置。
(18)上記受信部は、上記ビデオストリームを含む所定フォーマットのコンテナを受信し、
上記コンテナのレイヤには、上記第1の送信モードにあるか上記第2の送信モードにあるかを識別するための識別情報が挿入されており、
上記送信モード識別部は、上記コンテナのレイヤに挿入されている識別情報および上記ビデオストリームに挿入されている識別情報に基づいて、上記第1の送信モードにあるか上記第2の送信モードにあるかを識別する
前記(17)に記載の受信装置。
(19)1つまたは複数のビデオストリームを受信するステップと、
上記ビデオストリームに挿入されている識別情報に基づいて、スケーラブル符号化画像データを構成する最下位階層の画像データを含む基本ビデオストリームおよび上記スケーラブル符号化画像データを構成する最下位階層以外の階層の画像データをそれぞれ含む所定数の拡張ビデオストリームを送信する第1の送信モードであるか、基本画像データを含む基本ビデオストリームのみを送信する第2の送信モードであるかを識別するステップと、
上記受信されたビデオストリームに対して、上記モード識別結果に基づき、各モードに応じた処理を行って、画像表示のための画像データを得るステップとを備える
受信方法。
【0191】
本技術の主な特徴は、超高解像度画像(基本ストリームと拡張ストリーム)と従来画像(基本ストリーム)とを時分割的に送信する際に、ビデオストリームに送信モード識別情報(EHF,BCF)を挿入することで、受信側で,ストリーム構成の変化、つまり、配信内容の動的な変化に的確に対応でき、正しいストリーム受信を行うことを可能にしたことである(
図13参照)。