(58)【調査した分野】(Int.Cl.,DB名)
前記基本階層レベルの前記符号化データは、独立して復号可能であるか、または、前記基本階層レベルの他の前記符号化データの復号後のデータを参照することによって復号可能であり、
前記拡張階層レベルの前記符号化データは、前記基本階層レベルの前記符号化データの復号後のデータを参照することによって復号可能である
請求項1に記載の送信方法。
【発明を実施するための形態】
【0011】
(本発明の基礎となった知見)
映像符号化方式HEVC(High Efficiency Video Coding)は、時間スケーラブルに対応しており、例えば、120fpsの映像を60fpsの映像として再生することが可能である。
図1は、時間スケーラブルに符号化された符号化データを説明するための図である。
【0012】
時間スケーラブルに符号化された符号化データには、階層ごとにTemporal IDが付与されている。
図1では、例えば、Temporal IDが0のピクチャ(I0、P4)とTemporal IDが1のピクチャ(B2)とを表示させれば60fpsで映像が表示され、Temporal IDが2のピクチャ(B1、B3)をさらに追加で表示させれば120fpsで映像が表示される。
【0013】
図1の例では、Temporal IDが0または1である符号化データを基本レイヤ(基本階層レベル)とし、Temporal IDが2のデータを拡張レイヤ(拡張階層レベル)とする。
【0014】
基本レイヤのピクチャは、独立して符号化可能であるか、または、基本レイヤの他のピクチャを用いて復号可能である。これに対し、拡張レイヤのピクチャは、単独で復号不可能であり、
図1において矢印の始点に位置する参照ピクチャの復号後でなければ復号できない。このため、拡張レイヤのピクチャの参照ピクチャとなる、基本レイヤのピクチャは、拡張レイヤのピクチャに対して先に復号されなければならない。
【0015】
なお、復号順は、画像表示順とは異なる。
図1の例では、画像表示順が(I0、B1、B2、B3、P4)の並びであるのに対して、復号順は(I0、P4、B2、B1、B3)の並びである。画像表示順は、ピクチャごとに付与されるPTS(Presentation Time Stamp)に基づいて定められ、復号順は、ピクチャごとに付与されるDTS(Decode Time Stamp)に基づいて定められる。
【0016】
時間スケーラブル符号化の場合だけでなく、空間スケーラブル符号化およびSNRスケーラブル符号化の場合も、ピクチャを基本レイヤと拡張レイヤとに分けた場合、拡張レイヤに属するピクチャは、単独で復号不可能である。拡張レイヤに属するピクチャは、基本レイヤに属するピクチャと合わせて復号されなければならない。
【0017】
スケーラブルに符号化された(階層的に符号化された)符号化データは、受信側(復号側)においては容易に選別できることが望ましい。
【0018】
そこで、本発明の一態様に係る送信方法は、映像が階層的に符号化された符号化データの送信方法であって、前記符号化データがパケット化されたパケットであって、少なくとも前記符号化データの階層レベルに応じて異なるパケットIDが付与された前記パケットを含む符号化ストリームと、前記パケットIDと前記階層レベルとの対応関係を示す情報とを生成する生成ステップと、生成した前記符号化ストリームおよび生成した前記対応関係を示す情報を送信する送信ステップとを含む。
【0019】
これにより、パケットIDのフィルタリングによって符号化データを階層レベルごとに選別できる。つまり、受信側において符号化データが容易に選別できる。
【0020】
また、前記階層レベルには、基本階層レベルと、拡張階層レベルとが含まれ、前記基本階層レベルの前記符号化データは、独立して復号可能であるか、または、前記基本階層レベルの他の前記符号化データの復号後のデータを参照することによって復号可能であり、前記拡張階層レベルの前記符号化データは、前記基本階層レベルの前記符号化データの復号後のデータを参照することによって復号可能であってもよい。
【0021】
また、前記生成ステップでは、前記基本階層レベルの前記符号化データがパケット化された前記パケットを含み、かつ、前記拡張階層レベルの前記符号化データがパケット化された前記パケットを含まない前記符号化ストリームである第一符号化ストリームと、前記拡張階層レベルの前記符号化データがパケット化された前記パケットを含み、かつ、前記基本階層レベルの前記符号化データがパケット化された前記パケットを含まない前記符号化ストリームである第二符号化ストリームとを生成し、前記送信ステップでは、前記第一符号化ストリームを第一の伝送路を用いて送信し、前記第二符号化ストリームを前記第一の伝送路とは異なる第二の伝送路を用いて送信してもよい。
【0022】
また、前記生成ステップでは、前記第一符号化ストリームおよび前記第二符号化ストリームを、互いに異なる多重化方式にしたがって生成してもよい。
【0023】
また、前記生成ステップでは、前記第一符号化ストリームおよび前記第二符号化ストリームの一方を、MPEG2−TS(MovingPictureExpertsGroup−2TransportStream)にしたがって生成し、前記第一符号化ストリームおよび前記第二符号化ストリームの他方を、MMT(MPEGMediaTransport)にしたがって生成してもよい。
【0024】
また、前記第一の伝送路および前記第二の伝送路の一方は、放送用の伝送路であり、前記第一の伝送路および前記第二の伝送路の他方は、通信用の伝送路であってもよい。
【0025】
また、前記生成ステップでは、前記対応関係を示す情報を含む前記符号化ストリームを生成し、前記送信ステップでは、前記対応関係を示す情報を含む前記符号化ストリームを送信してもよい。
【0026】
また、前記対応関係を示す情報は、当該符号化ストリームが単独で復号可能であることを示す情報、および当該符号化ストリーム復号に必要な他の符号化ストリームを示す情報のいずれか一方を含んでもよい。
【0027】
なお、これらの包括的または具体的な態様は、システム、装置、集積回路、コンピュータプログラムまたはコンピュータ読み取り可能なCD−ROMなどの記録媒体で実現されてもよい。また、これらの包括的または具体的な態様は、システム、装置、集積回路、コンピュータプログラムおよび記録媒体の任意な組み合わせで実現されてもよい。
【0028】
以下、実施の形態について、図面を参照しながら具体的に説明する。
【0029】
なお、以下で説明する実施の形態は、いずれも包括的または具体的な例を示すものである。以下の実施の形態で示される数値、形状、材料、構成要素、構成要素の配置位置および接続形態、ステップ、ステップの順序などは、一例であり、本発明を限定する主旨ではない。また、以下の実施の形態における構成要素のうち、最上位概念を示す独立請求項に記載されていない構成要素については、任意の構成要素として説明される。
【0030】
(実施の形態1)
[送信方法]
以下、実施の形態1に係る送信方法(送信装置)について図面を参照しながら説明する。実施の形態1では、一例としてMMTにしたがって符号化データを送信する送信方法について説明する。
【0031】
まず、MMTにおける符号化ストリームのデータ構造について説明する。
図2および
図3は、MMTにおける符号化ストリームのデータ構造を説明するための図である。
【0032】
図2に示されるように、符号化データは、複数のAU(Access Unit)からなる。符号化データは、例えば、HEVCなどの動画像符号化規格に基づいて符号化されたAVデータである。符号化データは、具体的には、映像データ、音声データ、並びに、これらに付随するメタデータ、静止画およびファイルなどを含む。符号化データが映像データである場合、1つのAUは、1つのピクチャ(1フレーム)に相当する単位である。
【0033】
MMTでは、符号化データは、GOP(Group Of Picture)単位でMP4のファイルフォーマットにしたがって、MP4データ化される(MP4ヘッダが付与される)。MP4データに含まれるMP4ヘッダには、AUの提示時刻(上述のPTS)や復号時刻(上述のDTS)の相対値が記述される。また、MP4ヘッダには、MP4データのシーケンス番号が記述される。なお、MP4データ(MP4ファイル)は、MMT規格において定義されるデータ単位であるMPU(Media Processing Unit)の一例である。
【0034】
なお、以下では、MP4データ(ファイル)を送信する場合を例に挙げて説明するが、送信されるデータはMP4データでなくてもよい。例えば、MP4ファイルとは異なるファイルフォーマットのデータでもよく、符号化データと符号化データの復号に必要な情報(例えば、MP4ヘッダに含まれる情報)とが送信されていれば、受信側で符号化データを復号することができる。
【0035】
そして、
図3に示されるように、MMTにおける符号化ストリーム10は、プログラム情報11と、時刻オフセット情報12と、複数のMMTパケット13とを含む。言い換えると、符号化ストリーム10は、MMTパケット13のパケット列である。
【0036】
符号化ストリーム10(MMTストリーム)は、1つのMMTパッケージを構成する1以上のストリームの1つである。MMTパッケージは、例えば、1つの放送番組コンテンツに相当する。
【0037】
プログラム情報11は、符号化ストリーム10が、スケーラブル符号化されたストリーム(基本レイヤと拡張レイヤとの両方を含むストリーム)であることを示す情報や、スケーラブル符号化の種類および階層レベル数(階層数)の情報を含む。ここで、スケーラブル符号化の種類とは、時間スケーラビリティ、空間スケーラビリティ、およびSNRスケーラビリティなどであり、階層レベル数とは、基本レイヤおよび拡張レイヤ等のレイヤの数である。なお、プログラム情報11は、上記の情報を全て含む必要はなく、少なくともいずれか一つの情報を含んでいればよい。
【0038】
また、プログラム情報11は、例えば、複数のアセットと、パケットIDとの対応関係を示す情報などを含む。なお、アセットは、同一のトランスポート特性のデータを含むデータエンティティであり、例えば、映像データおよび音声データなどのいずれか1つである。また、プログラム情報11は、それぞれのパケットID(または、アセット)の階層関係を示す記述子を含んでいてもよい。
【0039】
プログラム情報11は、具体的には、MMTにおけるCI(Composition Information)およびMPT(MMT Package Table)である。なお、プログラム情報11は、MPEG2−TSでは、PMT(Program Map Table)であり、MPEG−DASHではMPD(Media Presentation Description)などである。
【0040】
時刻オフセット情報12は、AUのPTSまたはDTSを決定するための時刻情報である。時刻オフセット情報12は、具体的には、例えば、基本レイヤに属する先頭のAUの絶対的なPTSまたはDTSである。
【0041】
MMTパケット13は、MP4データがパケット化されたデータである。実施の形態1では、1つのMMTパケット13には、1つのMP4データ(MPU)が含まれる。
図3に示されるように、MMTパケット13は、ヘッダ13a(MTTパケットヘッダ。MPEG2−TSの場合はTSパケットヘッダ)と、ペイロード13bとを含む。
【0042】
ペイロード13bには、MP4データが格納される。なお、ペイロード13bには、MP4を分割したものが格納される場合がある。
【0043】
ヘッダ13aは、ペイロード13bに関する付属情報である。例えば、ヘッダ13aには、パケットIDが含まれる。
【0044】
パケットIDは、MMTパケット13(ペイロード13b)に含まれるデータのアセットを示す識別番号である。パケットIDは、MMTパッケージを構成するアセットごとに固有の識別番号である。
【0045】
符号化ストリーム10では、基本レイヤの映像データと、拡張レイヤの映像データとを異なるアセットとして取り扱う点が特徴である。つまり、符号化ストリーム10のMMTパケット13には、格納される符号化データの階層レベルに応じて異なるパケットIDが付与される。
図4は、符号化ストリーム10におけるパケットIDと、データ(アセット)との対応関係を示す図である。なお、
図4は、対応関係の一例である。
【0046】
図4に示されるように、実施の形態1では、基本レイヤの映像データ(基本階層レベルの符号化データ)がパケット化されたMMTパケット13には、パケットID「1」が付与される。つまり、ヘッダ13aにパケットID「1」が記述される。そして、拡張レイヤの映像データ(拡張階層レベルの符号化データ)がパケット化されたMMTパケット13には、パケットID「2」が付与される。つまり、ヘッダ13aにパケットID「2」が記述される。
【0047】
同様に、音声データがパケット化されたMMTパケット13には、パケットID「3」が付与され、時刻オフセット情報12がパケット化されたMMTパケット13には、パケットID「4」が付与される。プログラム情報11がパケット化されたMMTパケット13には、パケットID「5」が付与される。
【0048】
また、
図4に示されるような対応関係は、符号化ストリーム10のプログラム情報11内に記述される。なお、上記対応関係には、パケットID「1」が付与されたMMTパケット13とパケットID「2」が付与されたMMTパケット13とがペアであり、スケーラビリティに用いられることを示す情報が含まれる。
【0049】
以上説明したような、実施の形態1に係る符号化ストリーム10の送信方法(送信装置)について説明する。
図5は、実施の形態1に係る送信装置の構成を示すブロック図である。
図6は、実施の形態1に係る送信方法のフローチャートである。
【0050】
図5に示されるように、送信装置15は、符号化部16と、多重化部17と、送信部18とを備える。なお、送信装置15の構成要素は、具体的には、マイクロコンピュータ、プロセッサ、または専用回路などによって実現される。
【0051】
実施の形態1に係る符号化ストリーム10の送信方法においては、まず、パケットIDが付与されたMMTパケット13と、パケットIDと階層レベルとの対応関係を示す情報とを含む符号化ストリーム10が生成される(S11)。
【0052】
具体的には、多重化部17は、符号化部16から出力される符号化データのパケット化に際し、当該符号化データの階層レベルに応じてパケットIDを決定(選択)する。続いて、多重化部17は、決定されたパケットIDを含むMMTパケット13を生成する。一方で、多重化部17は、上記対応関係を示す情報を生成する。そして、多重化部17は、生成したMMTパケット13と生成した対応関係を示す情報とを含む符号化ストリーム10を生成する。
【0053】
生成された符号化ストリーム10は、送信部18により伝送路を用いて伝送される(S12)。
【0054】
このように、符号化データの階層レベルに応じて異なるパケットIDが付与されたMMTパケット13を含む符号化ストリーム10が送信されれば、受信側において従来のパケットフィルタの仕組みを利用して容易に符号化データを選別することができる。
【0055】
なお、パケットIDと階層レベルとの対応関係を示す情報は、符号化ストリーム10に含まれず、符号化ストリーム10とは別に伝送されてもよい。また、受信側でパケットIDと階層レベルとの対応関係が既に把握されている場合は、パケットIDと階層レベルとの対応関係を示す情報は、伝送されなくてもよい。
【0056】
例えば、上記対応関係を示す情報は、放送信号のような連続した信号の中に繰り返し挿入されるプログラム情報に含まれてもよいし、復号開始前に通信サーバから取得されてもよい。
【0057】
[受信方法]
以下、実施の形態1に係る受信方法(受信装置)について図面を参照しながら説明する。
図7は、実施の形態1に係る受信装置の構成を示すブロック図である。
図8は、実施の形態1に係る受信方法のフローチャートである。
【0058】
なお、以下の説明では、基本レイヤを階層レベルAと記載し、拡張レイヤを階層レベルBと記載する場合がある。
【0059】
図7に示されるように、受信装置20は、パケットフィルタ21と、プログラム情報解析部22と、制御部23と、パケットバッファ24と、復号部25と、提示部26とを備える。なお、受信装置20の構成要素のうち、パケットバッファ24および提示部26以外の構成要素は、具体的には、マイクロコンピュータ、プロセッサ、または専用回路などによって実現される。パケットバッファ24は、例えば、半導体メモリなどの記憶装置である。提示部26は、例えば、液晶パネルなどの表示装置である。
【0060】
図8に示されるように、まず、パケットフィルタ21は、符号化ストリーム10に含まれるMMTパケット13を分離し(S21)、プログラム情報11をプログラム情報解析部22に出力する。ここで、パケットフィルタ21は、予めプログラム情報11を含むMMTパケット13のパケットIDを認識している(または、プログラム情報11を含むMMTパケット13のパケットIDを他の制御情報から取得可能な)ため、符号化ストリーム10からプログラム情報11を含むMMTパケット13を分離できる。
【0061】
次に、プログラム情報解析部22は、プログラム情報11を解析する(S22)。プログラム情報11には、上述のようにパケットIDとアセットとの対応関係等が含まれる。
【0062】
一方で、制御部23は、どの階層レベルの符号化データ(MMTパケット13)を抽出するかを決定する(S23)。この決定は、入力受付部(
図7において図示せず)が受け付けたユーザの入力に基づいて行われてもよいし、提示部26の仕様(例えば、提示部26が対応しているフレームレートなど)に応じて行われてもよい。
【0063】
そして、パケットフィルタ21は、制御部23の制御に基づいて、決定された階層レベルの符号化データ(MMTパケット13)を抽出(フィルタリング)する(S24)。制御部23は、プログラム情報解析部22の解析により、階層レベルごとのパケットIDを認識しているため、パケットフィルタ21に決定された階層レベルの符号化データを抽出させることができる。
【0064】
続いて、パケットバッファ24は、パケットフィルタ21によって抽出された符号化データをバッファし、DTSのタイミングで復号部25に出力する(S25)。DTSのタイミングは、プログラム情報11、時刻オフセット情報12、および、例えば、MP4ヘッダ内で伝送される時刻情報に基づいて算出される。なお、空間スケーラビリティなどで、基本レイヤの符号化データと拡張レイヤの符号化データとに同じDTSが付与されているような場合は、基本レイヤの符号化データが拡張レイヤの符号化データより先に復号されるように、復号順が並び替えられてもよい。
【0065】
パケットバッファ24によってバッファされた符号化データは、復号部25によって復号され、PTSのタイミングで提示部26によって提示(表示)される(S26)。PTSのタイミングは、プログラム情報11、時刻オフセット情報12、およびMP4ヘッダ内の時刻情報に基づいて算出される。
【0066】
このような受信方法についてさらに
図9を用いて説明する。
図9は、実施の形態1に係る受信方法を概念的に示す図である。
【0067】
図9に示されるように、例えば、階層レベルが階層レベルAである(抽出対象が基本レイヤの符号化データのみである)と決定された場合、パケットフィルタ21は、パケットID「1」が付与されたMMTパケット13を全て抽出し、パケットID「2」が付与されたMMTパケット13は抽出しない。この結果、フレームレートの低い(例えは、60fps)映像が提示部26によって表示される。
【0068】
また、例えば、階層レベルが階層レベルA+Bである(抽出対象が基本レイヤの符号化データと拡張レイヤの符号化データとの両方である)と決定された場合、パケットフィルタ21は、パケットID「1」または「2」が付与されたMMTパケット13を全て抽出する。この結果、フレームレートの高い(例えば、120fps)映像が提示部26によって表示される。
【0069】
このように、受信装置20においては、パケットフィルタ21を利用して容易に基本階層レベルの符号化データと、拡張階層レベルの符号化データとを選別可能である。
【0070】
(実施の形態2)
[送受信方法]
以下、実施の形態2に係る送信方法および受信方法(受信装置)について図面を参照しながら説明する。
図10は、実施の形態2に係る受信装置の構成を示すブロック図である。
図11および
図12は、実施の形態2に係る送受信方法の概要を説明するための図である。なお、送信装置のブロック図、並びに、受信方法および送信方法のフローチャートについては、階層レベルIDを用いる点を除けば実施の形態1で説明したものとほぼ同一であるため、説明が省略される。
【0071】
図10に示されるように、実施の形態2に係る受信装置20aは、階層フィルタ27を備える点が受信装置20と異なる。
【0072】
図11の(1)に示されるように、実施の形態2に係る送信方法において送信される符号化ストリームでは、基本レイヤのMMTパケット13および拡張レイヤのMMTパケット13のそれぞれに、同一のパケットID(
図10ではパケットID:1)が付与される。
【0073】
そして、同じパケットIDが付与されたMMTパケット13に対して、階層レベルに関する識別子である階層レベルIDがパケットIDとは別に付与される。
図10の例では、階層レベルIDは、例えば、基本レイヤに対してA、拡張レイヤに対してBが付与される。パケットIDおよび階層レベルIDは、例えば、MTTパケットに対応するヘッダ13a(MTTパケットヘッダ)に記述される。
【0074】
階層レベルIDは、新規の識別子として規定されてもよいし、private user dataやその他の識別子を利用して実現されてもよい。
【0075】
なお、TSパケットヘッダが用いられる場合には、階層レベルIDは、新規の識別子として規定されてもよいし、既存の識別子を用いて実現されてもよい。例えば、トランスポートプライオリティ識別子およびエレメンタリーストリームプライオリティ識別子のいずれか一方、または両方を用いて階層レベルIDと同等の機能が実現可能である。
【0076】
図11の(2)および
図12の(2)に示されるように、伝送された符号化ストリームは、受信装置20aのパケットフィルタ21によってパケットフィルタリングされる。つまり、伝送された符号化ストリームは、パケットヘッダに付与されているパケットIDに基づいてフィルタリングされる。
【0077】
図11の(3)および
図12の(3)に示されるように、パケットフィルタリングされたMMTパケット13は、さらに、階層フィルタ27によって、階層レベルIDに基づいて階層レベルフィルタリングされる。フィルタリングされた符号化データは、パケットバッファ24で一旦バッファリングされた後、DTSのタイミングで復号部25によって復号される。そして、
図11の(4)および
図12の(4)に示されるように、復号後のデータは、提示部26によってPTSのタイミングで提示される。
【0078】
ここで、基本レイヤのみが復号された映像(例えば60fpsの映像)を得るためには、低階層の階層レベルID「A」のMMTパケット13(符号化データ)のみが復号されればよい。したがって、階層レベルフィルタリングにおいては、階層レベルID「A」のMMTパケット13のみが抽出される。
【0079】
一方、基本レイヤおよび拡張レイヤが復号された映像(例えば120fpsの映像)を得るためには、低階層の階層レベルID「A」のMMTパケット13、および、高階層の階層レベルID「B」のMMTパケット13の両方が復号される必要がある。したがって、階層レベルフィルタリングにおいては、階層レベルID「A」のMMTパケット13および階層レベルID「B」のMMTパケット13の両方が抽出される。
【0080】
このように、実施の形態2に係る受信方法(受信装置20a)は、階層レベルIDが「A」のMMTパケット13のみをフィルタリングして、基本レイヤのみの映像を復号および提示する系列と、階層レベルIDが「A」または「B」のMMTパケット13をフィルタリングして、基本レイヤ+拡張レイヤの映像を復号および提示する系列との2つの系列を有する。
【0081】
なお、パケットフィルタリングおよび階層レベルフィルタリングにおいてどのパケットIDまたは階層レベルIDをフィルタリングするかは、プログラム情報11に記述されているスケーラブル符号化の種類や、階層数の情報、および受信装置20aがどの階層の符号化データを復号および表示するか等を考慮して決定される。
【0082】
このような決定は、例えば、受信装置20aの持つ処理能力に応じて受信装置20aによって行われる。なお、送信装置は、さらに、コンテンツを復号および表示するために必要な受信装置20aの能力に係る情報をシグナリング情報として送信してもよく、このような場合、上記決定は、受信装置20aがシグナリング情報と受信装置20aの能力とを照らし合わせることにより行われる。
【0083】
なお、パケットフィルタ21と階層レベルフィルタ27とを一つにまとめたフィルタ部が設けられ、フィルタ部は、パケットIDと階層レベルIDとに基づいて一括でフィルタリングを行ってもよい。
【0084】
以上説明したように実施の形態2に係る送受信方法によれば、階層レベルIDのフィルタリングによって符号化データを階層レベルごとに選別できる。つまり、受信側において符号化データが容易に選別できる。また、パケットIDと階層レベルIDとが別々に付与されるため、パケットフィルタリングでは基本レイヤの符号化データおよび拡張レイヤの符号化データを同一のストリームとして扱うことができる。
【0085】
また、パケットに階層レベルIDを付与することにより、フィルタリングの動作のみで所望の階層符号化データを抽出可能となり、リアセンブルが不要となる。
【0086】
さらに、階層フィルタによって所望の階層符号化データを抽出できることにより、ベースレイヤのみの復号に対応した受信装置は、拡張レイヤのデータパケットをバッファするメモリを削減できる。
【0087】
[具体例1]
MMTでは、MP4データで構成されるMPUをMFU(Media Fragment Unit)にフラグメントし、MFU単位でヘッダ13aを付加してMMTパケット13を生成することができる。ここで、MFUは、最小NALユニット単位までフラグメント可能である。
【0088】
以下、実施の形態2の具体例1として、フラグメントしたMFU単位で符号化データをパケット化する例について説明する。
図13、
図14、および
図15は、フラグメントしたMFU単位で符号化データをパケット化する例を説明するための図である。なお、
図13、
図14、および
図15中で、白色のAUは、基本レイヤのAUを示し、ハッチングされたAUは、拡張レイヤのAUを示す(以下の
図16〜
図18においても同様である)。
【0089】
フラグメントされたMFUをパケット化する場合、MMTパケットヘッダのパケットIDには同一のパケットIDが付与され、さらに、MMTパケットヘッダに階層レベルIDが付与される。また、’ftyp’、’moov’、および、’moof’などの中で、階層レベルに無関係の共通のデータ(共通情報)のMMTパケットヘッダに対しては、共通であることを示すIDが付与される。
図13では、階層レベルA:基本レイヤ、階層レベルB:拡張レイヤ、階層レベルZ:共通情報とされている。ただし、基本レイヤと共通情報の階層レベルは同一であってもよい。
【0090】
このような構成の場合、階層レベルBの符号化データが1つのアセットとして取り扱われる。受信装置20aでは、パケットIDに基づくフィルタリングが行われた後、階層レベルのフィルタリングが可能な状態となる。
【0091】
基本レイヤの符号化データと拡張レイヤの符号化データとの両方を復号したい場合、受信装置20aにおいて、パケットIDに基づくフィルタリングを行った後、階層レベルIDに基づくフィルタリングにより全ての階層レベルIDを抽出する。つまり、階層レベルフィルタリングでは、階層レベルA:基本レイヤ、階層レベルB:拡張レイヤ、および、階層レベルZ:共通情報、の全てを抽出する。抽出されたデータは、
図14に示されるようなデータである。
【0092】
基本レイヤの符号化データのみを復号したい場合、受信装置20aにおいて、パケットIDに基づくフィルタリングを行った後、階層レベルA:基本レイヤ、および、階層レベルZ:共通情報をフィルタリングして抽出する。抽出されたデータは、
図15の(a)に示されるようなデータである。
【0093】
このとき、拡張レイヤのAUが除去されるため、復号部25においては、
図15の(b)に示されるように基本レイヤのAUが詰められた状態で取得される。しかし、’moof’に記述されているサンプル(AU)の時間オフセット情報やデータサイズは、拡張レイヤを含んだ状態で生成された情報である。このため、ヘッダに記述されている情報と、実際のデータとに不整合が生じる。
【0094】
したがって、除去したAUのサイズやオフセット情報などを別途記憶しておくなど、MP4データを再構築するのに必要な情報を記憶する必要がある。
【0095】
そこで、復号部25は、基本レイヤのAU、または、DTSおよびPTSを取得する際には、’moof’などのヘッダ情報において、拡張レイヤのAU(フィルタリングにより除去)が’mdat’内に存在しないことを考慮して復号処理を行ってもよい。
【0096】
例えば、’moof’におけるアクセスユニット(サンプル)のオフセット情報は、拡張レイヤのAUが存在するものとして設定されている。このため、復号部25は、基本レイヤのみを取得した場合には、オフセット情報から、除去されたAUのサイズを減算する。減算した得られるデータは、模式的には、
図15の(c)のようになる。
【0097】
同様に、DTSやPTSについても、除去された拡張レイヤのAUに対応するsample_duration(連続するアクセスユニット間のDTSの差分)や、sample_composition_time_offset(アクセスユニットにおけるDTSとPTSとの差分)に基づいて算出する。
【0098】
なお、上記のような減算の代わりに、基本レイヤのみを抽出したデータを復号するためのヘッダ情報(基本レイヤのみのAUに対するヘッダ情報)が予めMP4ヘッダに記述されてもよい。さらに、MP4ヘッダには、基本レイヤのみを復号する場合のヘッダ情報と、基本レイヤおよび拡張レイヤの両方を復号する場合のヘッダ情報とを識別するための情報が記述されてもよい。
【0099】
[具体例2]
以下、実施の形態2の具体例2として、MPUをフラグメントせずに、MPU単位でパケット化する例について説明する。
【0100】
まず、符号化データをそのままの順番でMP4データに配置する例について説明する。
図16は、符号化データをそのままの順番でMP4データに配置する例(異なる階層レベルのAUを同時に多重する場合)を示す図である。
【0101】
符号化データをそのままMP4データに配置する場合、’mdat’ boxの中の1つのtrackに、基本レイヤのAUと拡張レイヤのAUとが混在する。この場合、階層レベルIDは、AUごとに付与される。AU(サンプル)ごとの階層レベルIDは、’moov’や’moof’の中に記述される。なお、対応関係にある基本レイヤのAUと拡張レイヤのAUは、同じ’mdat’ boxに配置されるのが望ましい。なお、MP4データにトランスポートヘッダをつけてパケット化する際には、同一のパケットIDが付与される。
【0102】
以上のような構成では、パケットヘッダに階層レベルIDを付与できないため、パケット単位でのフィルタリングはできない。MP4データを解析することによってフィルタリングが可能となる。
【0103】
なお、別の方法として、符号化データの基本レイヤと拡張レイヤとをtrackに分けて、対応関係をヘッダに記述する方法もある。
【0104】
このようにパケット化されたデータは、受信装置20aにおいて、パケットフィルタリングされた後、MP4データの解析時にAUの階層レベルの判定が行われ、所望のレイヤのAUが抽出および復号される。
【0105】
次に、符号化データを階層レベルごとにMP4データに配置する第1の例について説明する。
図17は、符号化データを階層レベルごとにMP4データに配置する第1の例を示す図である。
【0106】
符号化データを階層レベルごとにMP4データに配置する場合、符号化データは、階層レベルごとに分離され、階層レベルごとにフラグメントの’mdat’ boxの中に配置される。この場合、階層レベルIDは、’moof’に記述される。共通のヘッダには、階層によらず共通の情報であることを示す階層レベルIDが付与される。
【0107】
また、パケットヘッダには、同一のパケットIDが付与される。この場合も、パケット単位でのフィルタリングは不可能である。
【0108】
このようにパケット化されたデータは、受信装置20aにおいて、パケットフィルタリングされた後、MP4データの解析時にフラグメントの階層レベルの判定が行われ、所望のレイヤのフラグメントが抽出および復号される。
【0109】
最後に、符号化データを階層レベルごとにMP4データに配置する第2の例について説明する。
図18は、符号化データを階層レベルごとにMP4データに配置する第2の例を説明するための図である。
【0110】
この例では、符号化データは、階層レベルごとに分離され、階層レベルごとに’mdat’ boxの中に配置される。
【0111】
基本レイヤのAUが格納されているMP4データと拡張レイヤのAUが格納されているMP4データを生成する。
【0112】
階層レベルIDは、MP4データのヘッダおよびトランスポートパケットヘッダのいずれか一方または両方に記述される。ここで、階層レベルIDは、MP4データ間またはトランスポートパケット間の階層関係を示す。なお、パケットヘッダには、同一のパケットIDが付与される。
【0113】
このようにパケット化されたデータは、受信装置20aにおいて、パケットフィルタリングされた後、パケットヘッダの階層レベルIDに基づいて所望のレイヤのパケットが抽出および復号される。
【0114】
[変形例]
上記実施の形態2では、パケットIDと階層レベルIDとが別々に付与されると説明したが、パケットIDの一部のビットを使用して階層レベルIDが付与されてもよいし、拡張パケットIDとして、新たにビットが割り当てられてもよい。なお、パケットIDの一部のビットを使用して階層レベルIDを付与することは、階層レベルIDを示すビット以外は同じIDを付与するというルールに基づき、階層レベルごとに異なるパケットIDを付与することと等価である。
【0115】
また、上記実施の形態2では、基本レイヤの符号化データと拡張レイヤの符号化データの両方を復号する場合、パケットフィルタリングや階層レベルフィルタリングによって、基本レイヤ+拡張レイヤのデータをフィルタリングによって抽出すると説明した。しかしながら、符号化データは、階層レベルフィルタリングにおいて一旦基本レイヤと拡張レイヤとに分別された後、再構築されてもよい。
【0116】
(その他の実施の形態)
本発明は、上記実施の形態に限定されるものではない。
【0117】
上記実施の形態1および2では、MMTにしたがって多重化された符号化ストリームについて説明した。しかしながら、符号化ストリームは、MPEG2−TS、またはRTP(Real Transport Protocol)など、その他の多重化方式にしたがって多重化されたものでもよい。また、MMTパケットがMPEG−TS2にしたがって送信されるような構成であってもよい。いずれの場合であっても、受信側で符号化データを容易に選別することができる。
【0118】
上記実施の形態1および2では、1つの符号化ストリームに基本レイヤの符号化データと、拡張レイヤの符号化データとが混在した。しかしながら、基本レイヤの符号化データからなる第一符号化ストリームと、拡張レイヤの符号化データからなる第二符号化ストリームとが、別々に生成されてもよい。ここで、第一符号化ストリームは、より詳細には、基本レイヤの符号化データがパケット化されたパケットを含み、かつ、拡張レイヤの符号化データがパケット化されたパケットを含まない符号化ストリームである。第二符号化ストリームは、拡張レイヤの符号化データがパケット化されたパケットを含み、かつ、基本レイヤの符号化データがパケット化されたパケットを含まない符号化ストリームである。
【0119】
このような場合、第一符号化ストリームと、第二符号化ストリームとは、互いに異なる多重化方式にしたがって生成されてもよい。例えば、第一符号化ストリームおよび第二符号化ストリームの一方が、MPEG2−TSにしたがって生成され、第一符号化ストリームおよび第二符号化ストリームの他方が、MMTにしたがって生成されてもよい。
【0120】
2つの符号化ストリームが、互いに異なる多重化方式にしたがって生成される場合、パケットIDまたは階層レベルIDは、それぞれの多重化方式にしたがって付与される。また、この場合、各符号化ストリームにおけるパケットIDの階層レベルとの対応関係または階層レベルIDの階層レベルとの対応関係は、共通のプログラム情報に記述される。具体的には、2つの符号化ストリームの一方にのみ上記共通のプログラム情報が含まれるか、または、2つの符号化ストリームの両方に上記共通のプログラム情報がそれぞれ含まれる。
【0121】
受信装置においては、プログラム情報に記述された対応関係に基づいて、パケットフィルタリング、階層レベルフィルタリングが行われ、所望の階層レベルの符号化データが抽出および復号される。すなわち、2つの符号化ストリームから1つの映像が表示される。
【0122】
また、第一符号化ストリームと、第二符号化ストリームとは、(物理的に)異なる伝送路を用いて伝送されてもよい。具体的には、例えば、第一符号化ストリームおよび第二符号化ストリームの一方は、放送用の伝送路を用いて伝送され、第一符号化ストリームおよび第二符号化ストリームの他方は、通信用の伝送路を用いて伝送されてもよい。このような伝送は、例えば、階層伝送や、チャネルをまたがって伝送するバルク伝送などの場合に想定される。この場合、それぞれのパケットIDや階層レベルIDの対応関係は共通のプログラム情報に記述される。なお、プログラム情報は共通のものでなくてもよい。受信装置が、パケットIDの階層レベルとの対応関係、または、階層レベルIDの階層レベルとの対応関係を認識できればよい。
【0123】
なお、上記実施の形態1および2では、1つの基本レイヤと、1つの拡張レイヤとの2つの階層からなる符号化ストリームについて説明したが、拡張レイヤが多段に構成されることにより、符号化ストリームは、3以上の階層レベルから構成されてもよい。この場合、3つの階層レベルそれぞれに異なるパケットID(または異なる階層レベルID)が付与される。
【0124】
なお、上記実施の形態1および2では、送信装置15は、符号化部16を備えるが、送信装置は、符号化機能を有しなくてもよい。この場合、送信装置15とは別に符号化機能を有する符号化装置が設けられる。
【0125】
同様に、上記実施の形態1および2では、受信装置20および20aは、復号部25を備えるが、受信装置20および20aは、復号機能を有しなくてもよい。この場合、受信装置20および20aとは別に復号機能を有する復号装置が設けられる。
【0126】
なお、上記実施の形態1および2において、各構成要素は、専用のハードウェアで構成されるか、各構成要素に適したソフトウェアプログラムを実行することによって実現されてもよい。各構成要素は、CPUまたはプロセッサなどのプログラム実行部が、ハードディスクまたは半導体メモリなどの記録媒体に記録されたソフトウェアプログラムを読み出して実行することによって実現されてもよい。
【0127】
また、上記実施の形態1において、特定の処理部が実行する処理を別の処理部が実行してもよい。また、複数の処理の順序が変更されてもよいし、複数の処理が並行して実行されてもよい。
【0128】
なお、本発明の包括的または具体的な態様は、システム、方法、集積回路、コンピュータプログラムまたはコンピュータ読み取り可能なCD−ROMなどの記録媒体で実現されてもよい。また、本発明の包括的または具体的な態様は、システム、方法、集積回路、コンピュータプログラムまたは記録媒体の任意な組み合わせで実現されてもよい。
【0129】
なお、本発明は、これらの実施の形態またはその変形例に限定されるものではない。本発明の趣旨を逸脱しない限り、当業者が思いつく各種変形を本実施の形態またはその変形例に施したもの、あるいは異なる実施の形態またはその変形例における構成要素を組み合わせて構築される形態も、本発明の範囲内に含まれる。
【0130】
本発明の1局面である第1の送信装置は、時間スケーラブル符号化されたデータを送信するものである。ここで、時間スケーラブル符号化されたデータは、レイヤに含まれるデータを用いて復号可能である基本レイヤのデータと、単独で復号不可能であり基本レイヤのデータと合わせて復号しなければならない拡張レイヤのデータを含む。ここで、基本レイヤのデータは、例えば60pの映像を復号するためのデータであり、拡張レイヤのデータは、例えば基本レイヤのデータと併せて用いることで120pの映像を復号するためのデータである。
【0131】
基本レイヤのデータは、第1パケットIDが付与された第1アセットとして伝送され、拡張レイヤのデータは、第2パケットIDが付与された第2アセットとして伝送される。パケットIDは、データが格納されたパケットのヘッダに記述される。送信装置は、基本レイヤのデータ、拡張レイヤのデータ、およびプログラム情報を多重化して送信する。ここでプログラム情報は、例えば、それぞれのパケットID(または各パケットIDに対応するアセット)の階層関係を示す識別子を含んでもよい。ここで、階層関係を示す情報とは、例えば、第1パケットID(第1アセット)のデータは単独で復号可能であることを示す情報と、第2パケットID(第2アセット)のデータは単独で復号が不可能であり、第1パケットID(第1アセット)のデータを用いて復号する必要があることを示す情報を含む。
【0132】
また、プログラム情報は、プログラムを構成するストリームが、スケーラブル符号化されたストリーム(基本レイヤと拡張レイヤの両方を含むストリーム)であることを示す情報、スケーラブル符号化の種類を示す情報、階層数を示す情報、および階層レベルに関わる情報の少なくともいずれか一つを含んでいてもよい。
【0133】
また、本発明の一局面である第1の受信装置は、時間スケーラブル符号化されたデータを受信するものである。ここで、時間スケーラブル符号化されたデータは、レイヤに含まれるデータを用いて復号可能である基本レイヤのデータと、単独で復号不可能であり基本レイヤのデータと合わせて復号しなければならない拡張レイヤのデータを含む。ここで、基本レイヤのデータは、例えば60pの映像を復号するためのデータであり、拡張レイヤのデータは、例えば基本レイヤのデータと併せて用いることで120pの映像を復号するためのデータである。
【0134】
基本レイヤのデータは、第1パケットIDが付与された第1アセットとして伝送され、拡張レイヤのデータは、第2パケットIDが付与された第2アセットとして伝送される。パケットIDは、データが格納されたパケットのヘッダに記述される。送信装置は、基本レイヤのデータ、拡張レイヤのデータ、およびプログラム情報を多重化して送信する。ここでプログラム情報は、例えば、それぞれのパケットID(または各パケットIDに対応するアセット)の階層関係を示す識別子を含んでもよい。ここで、階層関係を示す情報とは、例えば、第1パケットID(第1アセット)のデータは単独で復号可能であることを示す情報と、第2パケットID(第2アセット)のデータは単独で復号が不可能であり、第1パケットID(第1アセット)のデータを用いて復号する必要があることを示す情報を含む。
【0135】
また、プログラム情報は、プログラムを構成するストリームが、スケーラブル符号化されたストリーム(基本レイヤと拡張レイヤの両方を含むストリーム)であることを示す情報、スケーラブル符号化の種類を示す情報、階層数を示す情報、および階層レベルに関わる情報の少なくともいずれか一つを含んでいてもよい。
【0136】
上述した第1の送信装置および第2の受信装置によると、受信側では選択されたパケットID(アセット)のデータを復号するために必要なパケットID(アセット)をプログラム情報から取得して、パケットID(アセット)に基づくフィルタリングを行うことができる。例えば、第1パケットIDが付与された第1アセットを再生する場合、第1パケットID(第1アセット)のデータは単独で復号可能であるため、フィルタリングにより第1パケットID(第1アセット)のデータを取得する。一方、第2パケットIDが付与された第2アセットを再生する場合、第2パケットID(第2アセット)のデータは単独で復号が不可能であり、第1パケットID(第1アセット)のデータを用いて復号する必要があるため、フィルタリングにより第1パケットID(第1アセット)のデータと第2パケットID(第2アセット)のデータを取得する。
【0137】
なお、上記の構成では、プログラム情報に、各パケットID(アセット)のデータを復号するために必要な、当該パケットID(アセット)以外のパケットID(アセット)のデータを示す情報が記述されている。この構成によると、例えばスケーラブル符号化されたデータが、レイヤA、レイヤAと合わせて復号されるレイヤB、およびレイヤAと合わせて復号されるレイヤCという3つの階層を含むような場合にも、受信装置は、再生するレイヤが選択されると、複雑な判定を行うことなく復号に必要なデータが伝送されるパケットID(アセット)を特定することができる。
【0138】
特に、階層の深さが3以上になる場合や、複数種類のスケーラブル符号化で符号化されたデータが多重されて送信される場合等が将来的にあり得ることを考慮すると、複雑な判定を行うことなく復号に必要なデータが伝送されるパケットID(アセット)を特定することができる上記構成は有用である。