特許第6034458号(P6034458)IP Force 特許公報掲載プロジェクト 2022.1.31 β版

知財求人 - 知財ポータルサイト「IP Force」

▶ トムソン ライセンシングの特許一覧

特許6034458スケーラブルビデオコーディングを利用したリニアなデジタルTV番組の伝送方法
<>
  • 特許6034458-スケーラブルビデオコーディングを利用したリニアなデジタルTV番組の伝送方法 図000002
  • 特許6034458-スケーラブルビデオコーディングを利用したリニアなデジタルTV番組の伝送方法 図000003
  • 特許6034458-スケーラブルビデオコーディングを利用したリニアなデジタルTV番組の伝送方法 図000004
  • 特許6034458-スケーラブルビデオコーディングを利用したリニアなデジタルTV番組の伝送方法 図000005
  • 特許6034458-スケーラブルビデオコーディングを利用したリニアなデジタルTV番組の伝送方法 図000006
  • 特許6034458-スケーラブルビデオコーディングを利用したリニアなデジタルTV番組の伝送方法 図000007
  • 特許6034458-スケーラブルビデオコーディングを利用したリニアなデジタルTV番組の伝送方法 図000008
  • 特許6034458-スケーラブルビデオコーディングを利用したリニアなデジタルTV番組の伝送方法 図000009
< >
(19)【発行国】日本国特許庁(JP)
(12)【公報種別】特許公報(B2)
(11)【特許番号】6034458
(24)【登録日】2016年11月4日
(45)【発行日】2016年11月30日
(54)【発明の名称】スケーラブルビデオコーディングを利用したリニアなデジタルTV番組の伝送方法
(51)【国際特許分類】
   H04N 21/433 20110101AFI20161121BHJP
   H04N 21/438 20110101ALI20161121BHJP
   H04N 5/765 20060101ALI20161121BHJP
   H04N 5/92 20060101ALI20161121BHJP
【FI】
   H04N21/433
   H04N21/438
   H04N5/91 L
   H04N5/92 H
【請求項の数】2
【外国語出願】
【全頁数】15
(21)【出願番号】特願2015-153727(P2015-153727)
(22)【出願日】2015年8月3日
(62)【分割の表示】特願2011-527806(P2011-527806)の分割
【原出願日】2009年9月10日
(65)【公開番号】特開2016-15739(P2016-15739A)
(43)【公開日】2016年1月28日
【審査請求日】2015年9月2日
(31)【優先権主張番号】61/097,531
(32)【優先日】2008年9月16日
(33)【優先権主張国】US
(73)【特許権者】
【識別番号】501263810
【氏名又は名称】トムソン ライセンシング
【氏名又は名称原語表記】Thomson Licensing
(74)【代理人】
【識別番号】110001243
【氏名又は名称】特許業務法人 谷・阿部特許事務所
(72)【発明者】
【氏名】ルー シュピン
(72)【発明者】
【氏名】シェミモン マナリクディ アンスル
(72)【発明者】
【氏名】デイビッド アンソニー カンパナ
【審査官】 松元 伸次
(56)【参考文献】
【文献】 特開2002−010251(JP,A)
【文献】 米国特許出願公開第2007/0223582(US,A1)
【文献】 特表2008−533850(JP,A)
【文献】 特表2006−511149(JP,A)
(58)【調査した分野】(Int.Cl.,DB名)
G06F13/00
H04B7/24−7/26
H04L12/00−12/26
12/50−12/955
H04M3/00
3/16−3/20
3/38−3/58
7/00−7/16
11/00−11/10
H04N5/38−5/46
5/76
5/765
5/80−5/91
5/915
5/92
5/922
5/928−5/93
5/937−5/94
5/95−5/956
7/10−7/173
7/20−7/56
19/00−21/858
H04W4/00−8/24
8/26−16/32
24/00−28/00
28/02−72/02
72/04−74/02
74/04−74/06
74/08−84/10
84/12−88/06
88/08−99/00
(57)【特許請求の範囲】
【請求項1】
ビデオ再生装置内で第1の層及び第2の層において伝送されるエンコードされたデジタルビデオ信号を再生する方法であって、前記第2の層は前記第1の層の解像度、フレームレート及び品質のうちの少なくとも1つを向上させる情報を含み、前記方法が、
前記ビデオ再生装置において、前記第2の層のデータユニットを受信するステップと、
前記ビデオ再生装置において、前記第2の層の当該受信されたデータユニットをエンハンスメント層のメディアコンテナファイル内に保存するステップと、
前記ビデオ再生装置において、前記第2の層のデータユニットに対応する第1の層のデータユニットを受信するステップと、
前記ビデオ再生装置において、前記第1の層の更なるデータユニットを受信する間に前記第1の層のデータユニットを前記第2の層の対応するデータユニットと結合するステップであって、前記第2の層のデータユニットの全ては、前記第1の層の任意の対応するデータユニットが受信される前に受信されて保存され、前記第1の層のデータユニット及び前記第2の層のデータユニットは、デジタルサンプルを含み、前記結合するステップは、
合致する同期情報を有する前記第1の層のデジタルサンプル及び前記第2の層のデジタルサンプルを特定することであって、
第1の層のデータユニットのストリームの開始からの前記第1の層のアクセスポイントの時間的変位を、タイムスタンプに従い決定することと、
トラックタイムラインの開始からの時間的変位が前記第1の層の前記アクセスポイントの前記時間的変位と合致する、前記第2の層の前記データユニットを特定することであって前記エンハンスメント層のメディアコンテナファイルの時間とデジタルサンプルとを対応させた表にアクセスすることにより、前記トラックタイムラインの開始からの前記第2の層の前記データユニットの前記時間的変位を決定することを含み、前記時間とデジタルサンプルとを対応させた表は、前記第2の層のデジタルサンプルと、前記デジタルサンプルの各々の対応する期間と、を含み、前記時間とデジタルサンプルとを対応させた表における先行するデジタルサンプルすべての対応する期間すべてを加算することにより、前記デジタルサンプルの各々のデコード時刻が決定される、前記第2の層の前記データユニットを特定することと、
を含む、前記第1の層のデジタルサンプル及び前記第2の層のデジタルサンプルを特定すること、
を含む、前記結合するステップと、
前記ビデオ再生装置において、前記結合されたデータユニットをデコードすることによって出力ビデオフレームを生成するステップと、
を含む、前記方法。
【請求項2】
第1の層及び第2の層において伝送されるエンコードされたデジタルビデオ信号を再生する装置であって、前記第2の層が前記第1の層の解像度、フレームレート及び品質のうちの少なくとも1つを向上させる情報を含み、前記装置が、
前記第2の層のデータユニットを受信する手段と、
前記第2の層の当該受信されたデータユニットをエンハンスメント層のメディアコンテナファイル内に保存する手段と、
前記第2の層のデータユニットに対応する前記第1の層のデータユニットを受信する手段と、
前記第1の層の更なるデータユニットを受信する間、前記第1の層のデータユニットを前記第2の層の対応するデータユニットと結合する手段であって、前記第2の層のデータユニットの全てが、前記第1の層の任意の対応するデータユニットが受信される前に、受信され保存され、前記第1の層のデータユニット及び前記第2の層のデータユニットは、デジタルサンプルを含み、前記結合する手段は、合致する同期情報を有する前記第1の層におけるデジタルサンプル及び前記第2の層におけるデジタルサンプルを特定することにより前記データユニットを結合、前記特定することは、第1の層のデータユニットのストリームの開始からの前記第1の層のアクセスポイントの時間的変位を、タイムスタンプに従い決定することと、トラックタイムラインの開始からの時間的変位が前記第1の層の前記アクセスポイントの前記時間的変位と合致する、前記第2の層のデータユニットを特定することであって前記エンハンスメント層のメディアコンテナファイルの時間とデジタルサンプルとを対応させた表にアクセスすることにより、前記トラックタイムラインの開始からの前記第2の層の前記データユニットの前記時間的変位を決定することを含み、前記時間とデジタルサンプルとを対応させた表は、前記第2の層のデジタルサンプルと、前記デジタルサンプルの各々の対応する期間と、を含む、前記第2の層のデータユニットを特定することと、を含み、前記時間とデジタルサンプルとを対応させた表における先行するデジタルサンプルすべての対応する期間すべてを加算することにより、前記デジタルサンプルの各々のデコード時刻が決定される、前記結合する手段と、
前記結合されたデータユニットをデコードすることによって出力ビデオフレームを生成する手段と、
を含む、前記装置。
【発明の詳細な説明】
【技術分野】
【0001】
<関連特許出願>
本出願は、米国特許法第119条(e)の下で米国仮特許出願第61/097,531号(出願日2008年9月16日)の利益を主張し、当該仮特許出願の全体の内容は、参照することによって本願に包含されている。
【0002】
本発明は全体としてデータ通信システムに関し、特に、ビデオデータの伝送に関する。
【背景技術】
【0003】
現在のリニアなデジタルテレビ(TV)伝送システムにおいては、エンドユーザ端末で利用可能なTV番組の総数を制限する帯域の制約が存在する。高解像度のTV番組がますます一般的になってくると、この帯域の制約が目に見えてくる。プライムタイム(ゴールデンタイム)の視聴者を奪い合う高解像度(HD)番組等のさらに広い帯域を必要とするコンテンツがさらに多くなると、ピーク時間に使用可能な帯域幅がボトルネックになり得る。
【0004】
1日の間、一般的なTV放送サービスの帯域需要は、大きく変化するだろう。例えば、帯域需要は、一般的に、平日の午後6時から午後11時の間、及び週末の午前10時から午後11時までにおいてピークを迎える。ピーク時間において、全てではないにしてもほとんどの使用可能な帯域は使用されており、いくつかの条件において帯域が不十分でさえあり得る。一方、通常、オフピーク時間においては、帯域は十分に利用可能である。
【0005】
従って、オフピーク時間の帯域は十分に使用されておらず、ピーク時間においては、標準解像度(SD)及び高解像度(HD)TV番組に対するエンドユーザの要求に見合う十分な使用可能帯域幅がない。
【発明の概要】
【0006】
本発明の原理に従った例示の実施形態において、スケーラブルビデオコーディング(Scalable Video Coding(SVC))を使用した伝送方法が、ピークタイムの広い帯域幅を必要とするビデオの伝送をオフピーク時間ウインドウに移動する。今まで十分に使用されていなかったオフピークの帯域が、有利に使用されて、僅かなアップグレード費用でまたはアップグレード費用無しで全体の伝送効率が改善される。
【0007】
特に、SVCエンコーダによって生成されたビデオビットストリームは、1つのベース層及び1または複数のエンハンスメント層を含む。本発明原理に従っている1つの例示の実施形態において、通常は低いビットレート、低いフレームレート及び低いビデオ品質でエンコーディングされているベース層ビデオストリームは、エンドユーザ端末に生でストリーム配信されるかまたは放送される一方で、1または複数のエンハンスメント層ビデオストリームは、開始時間以前のオフピーク時間の間にエンドユーザ端末に徐々にダウンロードされる。
【0008】
本発明による伝送方法は、リニアなTVサービスに使用されて、ピーク時間の帯域消費を減少させることが可能である。さらに、ベース層ビデオが基本のサービスとして扱われることが可能であり、その一方でエンハンスメント層ビデオがその高いビデオ品質に関する上位サービスとして扱われることも可能である。デジタル著作権管理(DRM)等が使用されて、エンハンスメント層ビデオへのアクセスが制御されてもよい。
【0009】
上述のように、かつ発明を実施するための形態から明らかになるように、他の実施形態及び特徴も利用可能でありかつ本発明の原理内に含まれる。
【0010】
本発明の実施形態に従った装置及び/または方法のいくつかの実施形態が、例示のみの目的で、添付の図面を参照して説明される。
【図面の簡単な説明】
【0011】
図1】一般的なビデオ伝送環境のブロック図である。
図2】本発明の原理に従った例示のビデオ伝送システムのブロック図である。
図3A】SVCエンハンスメント層ビデオ情報を含むメディアコンテナファイルの例示の形式を示す図である。
図3B】SVCエンハンスメント層ビデオ情報を含むメディアコンテナファイルの例示の形式を示す図である。
図3C】SVCエンハンスメント層ビデオ情報を含むメディアコンテナファイルの例示の形式を示す図である。
図4】SVCベース層ビデオ情報を伝送するためのパケットストリームの例示の形式を示す図である。
図5】本発明の例示の実施形態のデバイス受信動作方法例のフロー図である。
図6】事前にダウンロードされているエンハンスメント層データとストリーム配信されたベース層データとの同期化を示す図である。
【発明を実施するための形態】
【0012】
本発明の概念以外、添付図面に示されている要素は、公知であり、詳細には説明されていない。例えば、本発明の概念以外、テレビ放送、受信機及びビデオエンコーディングについて熟知していることが前提とされ、これらは本明細書には詳細に説明されていない。例えば、本発明の概念以外、NTSC(National Television System Committee)、PAL(Phase Alternation Lines)、SECAM(SEquential Couleur Avec Memoire)、及びATSC(Advanced Television System Committee)(ATSC)、中国デジタルテレビシステム(GB)20600−2006、及びDVB−H等のTV規格に関する現在の勧告及び今まで提案された勧告への熟知が前提とされる。同様に、本発明の概念以外、8−VSB(eight−level vestigial sideband)、QAM(Quadrature Amplitude Modulation)等の他の伝送概念、並びにラジオ周波数(RF)フロントエンド(front−end)(ローノイズブロック(low noise block)、チューナ、ダウンコンバータ(down converter)等)、デモジュレータ、コリレータ、リークインテグレータ(leak integrator)、及びスクエアラ(squarer)等の受信コンポーネントの熟知が前提とされる。さらに、本発明の概念以外、IP(Internet Protocol)、RTP(Real−time Transport Protocol)、RTCP(RTP Control Protocol)、UDP(User Datagram Protocol)等のプロトコルへの熟知が前提とされ、本明細書において説明されていない。同様に、本発明の概念以外、MPEG(Moving Picture Expert Group)−2システム規格(ISO/IEC 13818−1)、H.264 AVC(Advanced Video Coding)及びスケーラブルビデオコーディング(SVC)が前提にされ、本明細書において説明されていない。本発明の概念が、それ自体は本明細書に記載されていない従来のプログラミング技術を用いて実装されてもよいことに留意すべきである。最後に、図面内の同様の参照符号は同様の要素を示す。
【0013】
ほとんどのTV番組は、現在、図1に示されているようなシステムで伝送されている。示されているシステム100において、AVC(Advanced Video Coding)/MPEG−2エンコーダ110が、例えばTV番組に対応するビデオ信号101を受信し、STB150で示されている1または複数のセットトップボックス(STB)への配信のために生放送(live broadcast)信号125を生成する。その後、セットトップボックスは、受信した生放送信号125をデコーディングし、高解像度(HD)または標準解像度(SD)ビデオ等のビデオ信号165を、ユーザに表示するためのTV等の表示デバイス170に提供する。ビデオ信号165を生成するためにSTBによって必要とされる情報の全ては、信号125を介した生放送である。信号125は、有線または無線通信チャンネルを含む任意の適切な手段で伝送されてもよい。
【0014】
図2は、本発明の原理に従った例示のシステム200を示している。このシステムにおいて、エンコーディングされたビデオは、ビデオサーバ210からSTB等のエンドユーザ端末に、スケーラブルビデオコーディング(SVC)等の高度なコーディング技術を使用して伝送される。ビデオ信号201に基づいて、サーバ210のSVCエンコーダ212は、少なくとも2つの空間的に拡張可能な(spatially scalable)ビデオ層ストリームを生成する。すなわち、低いビットレートのSD解像度を用いた1つのベース層ストリーム、及び高いビットレートのHD解像度を用いた1つのエンハンスメント層ストリームである。ビデオ信号201は、例えば、HDTV番組に対応している。SVCベース層及びSVCエンハンスメント層は、ストリーム224及び226を介してSTB250に各々伝送される。本明細書においては空間的に拡張可能(例えば、SD対HD)という用語で説明されているが、本発明の原理は、SVC拡張性の時間的及び品質的なモードにも適用可能である。
【0015】
本発明によって考慮されているように、異なったSVC層は、異なった時間にエンドユーザ端末に伝送される。1つの例示の実施形態において、SVCエンハンスメント層ストリーム226は、オフピーク時間帯にSTB250に送信され、その一方で、対応するベース層ストリーム224は、視聴時間にSTB250に、例えば、ビデオ信号265が、表示デバイス270によりエンドユーザに表示するためにSTBによって生成される際に送信される。視聴時間は、1日の内のピーク帯域需要時間帯を含む任意の時間に発生してもよいことが考慮されている。
【0016】
エンハンスメント層ストリーム226が、エンコーディングする時刻にSTB250に送信されてもよい一方で、時間的にに送信されるベース層ストリーム224は、記憶装置213等に保存され、視聴時刻にSTB250への伝送のために記憶装置から読み出される。代替的に、ビデオ信号201は、エンコーダ212によって生成されたときに送信されるベース層ストリーム224を用いて視聴時間において再生(re−play)されかつ再度エンコーディングされ得、それによって記憶装置213が除去される。図示していないが、エンハンスメント層ストリーム226は、生成された後に保存され、STB250に送信されるときに記憶装置から読み出されてもよい。保存及び読み出しのための任意の適切な手段が、ストリーム224及び/または226に対して使用可能である。
【0017】
異なった層のビデオストリーム224、226は、STB250等のエンドユーザ端末がSVCデコーティングのこれらの異なったビデオストリームを再同期化及び結合可能な限り、異なった伝送メカニズム(例えば、ファイルダウンロード、ファイルストリーミング配信等)を使用して送信される。別々のストリームとして説明されているが、ストリーム224及び226は、サーバ210からSTB250まで、同一または異なった物理チャンネル及び関連付けられた物理層デバイスを用いて送信されてもよい。例示の実施形態において、ストリーム224及び226は、異なったサーバから伝送されてもよい。
【0018】
STB250は、デコーディングのためにこれら2つのストリームを再同期化して結合し、そこから表示デバイス270によって表示されるビデオ265を生成する。ベース層ストリーム224がSTB250によって受信される際に、ビデオ信号265が生成されると考えられる。上述のように、エンハンスメント層ストリーム226は、ベース層ストリーム224より早い時刻に受信され、この場合、エンハンスメント層ストリーム226は、SVCデコーダ259によるデコーディングのために2つのストリームが255において結合する時間まで、メモリ257に保存されるだろう。通常、エンハンスメント層ストリーム226は、ベース層ストリーム224のデータが受信される前に完全に保存される。
【0019】
例示の実施形態において、エンハンスメント層ストリーム226は、ビデオフレーム各々のデコーディングタイミング情報を維持するMP4ファイル等のメディアコンテナファイルの形式にされる。サーバ210のファイルライタブロック216は、SVCエンコーダ212によって生成されたエンハンスメント層ストリームを上述のメディアコンテナファイルの形式にする。このファイルは、STB250にダウンロードされて256で保存される。デコーディング時刻においてまたはその少し前において、STB250のファイルリーダブロック256が、当該ダウンロードされたメディアコンテナファイル内に含まれているエンハンスメント層ビデオデータ及びそれに関連するタイミング情報を抽出する。ファイルライタ216及びファイルリーダ256の動作は、変更されたMPファイル構造に関して以下でさらに詳しく説明される。
【0020】
信号201によって示されるTV番組が表示に関してスケジューリングされている場合、ベース層ビデオストリーム224は、生放送、ネットワークストリーミング配信等を介して、STB等の複数の受信デバイスに放送(送信)される。例示の実施形態において、ベース層ビデオストリーム224の放送(送信)は、リアルタイムプロトコル(RTP)ストリーミングを用いて行われる。RTPは、ベース層ストリーム224を上述のメディアコンテナファイル内のエンハンスメント層データと同期化するために使用されるヘッダ内の時間情報を提供する。サーバ210において、パケタイザ(packetizer)214は、STB250にストリーミング配信するためにSVCベース層をRTPパケット形式にする。STB250において、デパケタイザ(de−packetizer)254は、ブロック255によってエンハンスメント層と同期化させて結合させるために受信されたベース層RTPパケットストリーム224からベース層ビデオデータ及びタイミング情報を抽出する。パケタイザ214及びデパケタイザ254の動作は、例示のRTPパケット構造を参照して以下でされに詳細に説明される。
【0021】
エンハンスメント層ファイルは、デジタル著作権管理(DRM)保護付きであってもよい。エンハンスメント層ビデオに対して条件付きアクセスを用いることは、高度なビデオをベース層ビデオに追加される上位アドオンサービスとして提供することを可能にする。例えば、HD番組は、エンハンスメント層への条件付きアクセスによって提供され得、その一方で、SD番組はベース層へのアクセスによって全ての契約者に提供され得る。HD番組のこれらの契約に関して、1または複数のエンハンスメント層ファイルが、後に使用される1または複数のHD番組の全てまたは一部に関して、STBに前もってダウンロードされるだろう。エンハンスメント層ファイルの各々は、1もしくは複数のHD番組またはHD番組の一部のデータを含んでもよい。HD番組を契約していないユーザは、インジケータ等に基づいて、エンハンスメント層データ受信できるかもしくは受信できなくてもよく、または当該ファイルを受信できるが保存もしくは復号できなくてもよい。インジケータは、例えば、様々な可能性があるが、ユーザがパスワードもしくはアクセスコードを間違えなく入力するかまたはユーザのSTBにスマートカードを挿入すること等のユーザとのやりとりに基づいて設定されてもよい。エンハンスメント層ファイルがDRM保護付きであり、STB250がこれらを復号可能である場合、このような復号は258において行われ、復号されたエンハンスメント層データは、その後、ファイルリーダ256に提供される。代替的に、復号は、ファイルリーダ256によって行われてもよい。ファイルリーダ256は、復号されたエンハンスメント層データを、視聴時間にSTB250にストリーミング配信されたベース層データとの同期化及び結合のためにブロック255に提供する。結合されたデータは、その後、ビデオ信号265のデコーディング及び生成のためにSVCデコーダ259に送られる。RTPストリーム内の対応するSVCベース層を有するMP4ファイル内のSVCエンハンスメント層を同期化及び結合する例示の方法は、以下に説明される。
【0022】
例示の実施形態において、エンハンスメント層への条件付きアクセス機能は、同期化及び結合ブロック255によって制御されてもよい。例えば、エンハンスメント層メディアコンテナファイル内のデジタルセキュリティ機能が、STB250がエンハンスメント層データを使用する権利を有していると示す場合、ブロック255は、エンハンスメント層データとベース層データとの同期化及び結合を行い、そうでない場合、同期化及び結合はスキップされ、ベース層データのみがSVCデコーダ259に送られる。セキュリティ機能は、エンハンスメント層がデコーディング可能な回数を示すインジケータを含んでもよい。この回数は、エンハンスメント層がデコーディングされるたびに、エンハンスメント層のデコーディングが許可されなくなるまでデクリメント(減少)させられる。
【0023】
上述のように、本発明の例示の実施形態において、エンコーディングされたSVCストリームのベース層及びエンハンスメント層は、生放送のために、各々、事前ダウンロード可能なMP4ファイルとRTPパケットストリームに分割される。ISO規格化団体は、エンコーディングされたAVCコンテンツの包含のためにMP4ファイル形式を定義している(ISO/IEC 14496−15:2004 情報技術--オーディオビジュアルオブジェクトのコーディング--第15部:AVC(Advanced Video Coding)ファイル形式)が、MP4ファイル形式は、SVCでコーディングされたコンテンツにも容易に拡張可能である。図3A−3Cは、変更されたMP4ファイル内のエンコーディングされたSVCエンハンスメント層コンテンツの例示のレイアウトを示している。
【0024】
図3A及び3Cに示されているように、本発明の例示の実施形態において使用される変更されたMP4ファイル300は、メタデータアトム(metadeta atom)301及びメディアデータアトム(metadeta atom)302を含んでいる。メタデータアトム301は、編集リスト320を含んでいるSVCトラックアトム310を含んでいる。編集リスト320の編集内容の各々は、メディア時間及び存続期間を含んでいる。この編集内容は、端末相互間に配され、トラックタイムラインを生成する。SVCトラックアトム310は、サンプル表(sample table)340を含んでいるメディア情報アトム330も含む。サンプル表340は、サンプル記述アトム350、時間とサンプルとを対応させた表360及びスケーラビリティ(scalability)レベル記述子アトム370を含む。時間とサンプルとを対応させた表360は、メディアのタイミング及び構造データを含んでいる。アトム360のさらに詳細な表示は、図3Bに示されている。図3Bに示されているように、アトム360内のエントリの各々は、エンハンスメント層のコーディングされているビデオサンプル及び当該ビデオサンプルの対応する存続期間dTへのポインタを含んでいる。サンプルは、デコーディング順に保存される。サンプルのデコーディングタイムスタンプは、編集リスト内の全ての先行するサンプルの存続期間を追加することによって判定されてもよい。時間とサンプルとを対応させた表は、図3Bに示されているように、これらの存続期間を与える。
【0025】
図3Cに示されているメディアデータアトム302は、アトム360内のポインタによって参照されるエンハンスメント層のコーディングされたビデオサンプルを含む。メディアデータアトム302内のサンプルの各々は、アクセスユニット及び対応する長さを含む。アクセスユニットは、連続的なネットワーク抽象化層(NAL)ユニットの1つのセットであり、このセットのデコーディングは、1つのデコーディングされたピクチャをもたらす。
【0026】
図3A−3Cに示された例示のファイル形式が、SVCエンハンスメント層データしか含まないことに注意する。SVCベース層データ及びエンハンスメント層データの両方を含むファイル形式は、エンハンスメント層サンプルとインタリーブ(interleave)されたベース層サンプルを含む。
【0027】
図2の例示のシステム200を参照すると、図3A−3Cに示されているファイル等の変形されたMP4ファイルを生成する場合、サーバ210内のファイルライタ216は、タイミング情報を有するエンハンスメント層NALUを、SVCエンコーダ212からMP4ファイルのメディアデータアトム構造内にコピーする。上述のように、変更されたMP4ファイルは、当該ファイルが関連する番組の生放送の前に、STB250に事前にダウンロードされる。
【0028】
STB250内のファイルリーダ256は、サーバ210内のファイルライタ216の逆の機能を実行する。ファイルリーダ256は、257内に保存されている事前にダウンロードされているメディアコンテナファイルを読み込み、アトム360内のタイミング情報を有するエンハンスメント層NALU、及びISO/IEC JTC1/SC29/WG11 CORDING OF MOVING PICTURES AND AUDIO(ISO/IEC 14496−15 Amendment 2−情報技術--オーディオビジュアルオブジェクトのコーディング--スケーラブルビデオコーディングのファイルフォーマットサポート)に定義されているようなアトム370内のスケーラビリティレベル記述子を抽出する。
【0029】
RTPでSVCエンコーディングされたストリームのパケット化及び伝送は、IETFによって特定されている(例えば、SVCビデオに関するRTPペイロードフォーマット、IETF、2009年3月6日参照)。ベース層及びエンハンスメント層NALUは、別々のRTPパケット内にパケット化されてもよい。図4は、本発明の例示の実施形態に従って、SVCベース層のみを送信するRTPパケットストリームを示している。パケットの各々のRTPタイムスタンプは、コンテンツのサンプリングタイムスタンプに設定されている。
【0030】
図2の例示のシステム200を参照すると、サーバ210のパケタイザ214が、RTPヘッダタイムスタンプ領域内にコピーされているタイミング情報を用いて、RTPプロトコルに従ってSVCベース層NALUをパケット化している。デパケタイザ254は、STBのネットワークバッファ(図示せず)からSTBによって受信されたパケットを読み込んで、関連するタイミング情報を有するベース層NALUを抽出する。
【0031】
そこから抽出されたタイミング情報に基づいて、STB250内の同期化及び結合モジュール255が、デパケタイザ254及びファイルリーダ256から得られたベース及びエンハンスメント層NALUを同期化及び結合する。同期化の後、生RTPストリームから非パケット化されたベース層NALUと事前にダウンロードされていたMP4ファイルから抽出される対応するエンハンスメントNALUとが結合される。例示の実施形態において、ベース層NALUとエンハンスメント層NALUとの結合は、デコーダ259に対して、正確なデコーディング順序でNALUを表示することを含んでもよい。結合されたNALUは、その後、適切なSVCデコーディングのためにデコーダ259に送信される。
【0032】
本発明の原理に従ったSTB250等の受信デバイスの例示の動作方法のフロー図が図5に示されている。505において、STBは、後に視聴される番組のエンハンスメント層ビデオ(ELV)ファイル507を、サーバ210等から受信して保存する。510において、上述の番組の視聴時間に先立って、STB250がサーバ210から、番組に関連しており、RFC2327に記載されているセッション記述プロトコル(SDP)に従っているようなセッション記述ファイルを受信する。このSDPファイルは、1または複数の関連付けられたエンハンスメント層の存在及びそれらの暗号化情報を特定してもよい。515において、STBは、STBが番組に対して関連付けられたELVファイルを有しているか、及び上述のようにELVファイルが上位サービス契約に関係しているDRMによって保護されている場合に、STBが当該ELVファイルを復号して読み込めるかを判定する。そうであるならば、上述のファイルリーダ機能256等のELVファイルリーダ処理が520で開始される。
【0033】
525において、STBは、RTPストリーミング等によって、SVCベース層のパケット(1または複数)のフレームを受信する。ベース層フレームの各々は、図4に示されているような、1または複数のパケットによって表されてもよい。530において、ベース層フレームは、さらなる処理のために非パケット化される。図4に示されているように、ベース層RTPパケットの各々は、RTPヘッダ及びSVCベース層NALUを含む。535において判定されるように、関連付けられたELVファイルが存在し、STBがそれを読み込み可能であるならば、動作は540に進み、そこにおいて、同期化情報が非パケット化されたベース層フレームから抽出される。このような同期化情報は、例えば、フレームのベース層パケット(1または複数)のヘッダ内のRTPタイムスタンプを含んでもよい。545において、ベース層フレームのタイミング情報と合致するタイミング情報を有しているエンハンスメント層アクセスユニットのNALUがELVファイル507から読み込まれる。タイミング情報に基づいて、エンハンスメント層NALUを特定する例示の方法が以下に説明されている。ベース層NALU(1または複数)及びそれに合致するエンハンスメント層NALU(1または複数)は、550において結合、すなわち、それらのタイミング情報に基づいて適切に並べられ、当該結合されたものが表示のために555においてデコーディングされる。
【0034】
535において、ベース層がSTBにストリーミング配信されている番組に関連付けられているELVファイルが無い場合、またはSTBがELVを読み込めない場合、動作は555に進み、そこで単独のベース層フレームが視聴のためにデコーディングされる。
【0035】
560において、番組が終了を迎えたかに関する判定が行われる。番組に関するベース層パケットがもはや受信されなくなった時に終了を迎える。そうではない場合、動作が525にループバックして次のベース層フレームが受信されて、上述の手順が繰り返され、これ以外の場合、図5の処理が終了する。ELVファイル507が番組の終了の前に完全に読み込まれている場合、利用可能であるならば他のELVファイルが読み込まれるか、または動作はエンハンスメント層無しでベース層のみのデコーディングを行う。
【0036】
上述の例は、MP4及びRTPを用いて与えられているが、同期化メカニズムは、他の規格形式の中で、例えば、MP4及びMPEG2−TSに適用されてもよい。
【0037】
複数のエンハンスメント層を用いた応用に関して、全てのエンハンスメント層が1または複数のファイルで事前にダウンロードされて、ベース層がストリーミング配信されてもよい。代替的に、1または複数のエンハンスメント層が事前にダウンロードされ、1または複数のエンハンスメント層がベース層とともにストリーミング配信されてもよい。
【0038】
図6は、上述の変更されたMP4ファイル等であって、RTPストリームにおいて受信されるベース層データに対応している事前ダウンロードメディアコンテナファイル内のエンハンスメント層データを特定する例示の方法を示している。ベース層RTPパケットBnがサーバからストリーミング配信される場合、STBは、ストリーミング配信が開始された後のある時点でこのストリーミングを受信(tune into)する(605)。ベース層RTPパケットBnの各々は、ストリーム内の第1のパケットのタイムスタンプB1(例えば、t1=0)が基準となるRTPタイムスタンプtnを有している。
【0039】
図6の例に示されているように、STBは、ベース層パケットB2のストリーミングの間に受信を行う。しかし、このストリームを適切にデコーディングするために、STBはアクセスポイントを受信しなければならず、この受信はパケットB3が受信される際に発生する。パケットB3のタイムスタンプは、メディアコンテナファイル内の対応するエンハンスメント層データE3を発見するために使用される。換言すれば、メディアコンテナファイル内のトラックタイムラインの開始からtn−t1であるエンハンスメント層データサンプルは、ベース層パケットBnに対応しているだろう。データサンプルが上述の変更されたMP4形式等で、それらに対応する存続期間を用いて一覧化された場合、先行するサンプルの存続期間が合計されてトラックタイムラインの開始からのデータサンプルの時間的変位、すなわちRTPタイムスタンプに相当するデータサンプルが決定される。従って、図6で示されているように、E3は、B3に対応して決定される。なぜならば、E1及びE2の存続期間の合計dT1+dT2は、t3−t1、ベース層RTPストリームの開始からのB3の時間的変位に等しいからである。このように、STBの同期化及び結合モジュール(255)は、生ストリーミング放送から得られる第1のアクセスポイントパケット(Bn)のRTPタイムスタンプを、RTPストリームの開始からのパケットの時間的変位を決定するための基準点として使用する(すなわち、tn−t1)。その後、同期化及び結合モジュールは、事前にダウンロードされているエンハンスメント層メディアコンテナファイルの時間とサンプルとを対応させた表(360)をチェックし、トラックタイムラインの開始からの同一のまたは実質的に同一の時間的変位を有するエンハンスメント層サンプルを検索する。図6において、B3及びE3は、同期化されてSVCデコーディングに関して一緒に提供される第1のベース及びエンハンスメント層データを表す。
【0040】
上記のことを考慮して、上述の記載は、本発明の原理を例示しているだけであり、当業者が、本明細書内に明示的に記載していなくとも、本発明の原理を含みかつ本発明の精神及び範囲内にある様々な代替の構成を考え出すことが可能であることが理解されるだろう。例えば、別個の機能的要素の文脈で説明されていたとしても、これらの機能的要素は、1つの集積回路(IC)内、または複数の集積回路(IC)内で具体化されてもよい。同様に、別個の要素として示されていても、いくつかまたは全ての要素は、例えば、任意の様々な適切な記憶媒体内に具体化されているソフトウェアであって、1または複数のステップに対応する関連付けられたソフトウェアを実行するデジタル信号プロセッサまたは汎用プロセッサ等の、保存されているプログラムによって制御されているプロセッサ内に実装されてもよい。さらに、本発明の原理は、例えば、地上放送波、衛星、Wi−Fi(Wireless−Fidelity)、携帯電話等の、様々なタイプの有線及び無線通信システムに適用可能である。実際、本発明の概念は、固定または携帯受信器に適用可能である。従って、様々な変更を例示の実施形態に対して行うことが可能であり、他の構成も本発明の精神及び範囲から逸脱することなく考え出すことが可能であることが理解されるべきである。
本発明の好ましい実施形態を以下に示す。
付記1.第1の層及び第2の層において伝送されるエンコーディングされたデジタルビデオ信号を再生する方法であって、前記第2の層は前記第1の層の解像度、フレームレート及び品質のうちの少なくとも1つを向上させる情報を含み、前記方法が、
前記第2の層のデータユニットを受信するステップと、
前記第2の層の当該受信されたデータユニットを保存するステップと、
前記第2の層のデータユニットに対応する第1の層のデータユニットを受信するステップと、
前記第1の層の更なるデータユニットを受信する間に前記第1の層のデータユニットを前記第2の層の対応するデータユニットと結合するステップであって、前記第2の層のデータユニットは、前記第1の層の対応するデータユニットが受信される前に受信されて保存される、ステップと、
前記結合されたデータユニットをデコーディングすることによって出力ビデオフレームを生成するステップと
を含むことを特徴とする方法。
付記2.前記結合されたデータユニットのデコーディングが許可されていることをインジケータが示している場合に、前記第2の層のデータユニットが保存されることを特徴とする付記1に記載の方法。
付記3.ユーザ入力を受信して、前記結合されたデータユニットのデコーディングの許可または前記結合されたデータユニットのデコーディングの不許可のうちの1つに前記インジケータを設定するステップをさらに含むことを特徴とする付記2に記載の方法。
付記4.前記第1の層のデータユニットの受信に応答して前記第2の層の前記保存されたデータユニットを含むファイルを特定するステップと、
前記第2の層のデータユニットを検索するために前記ファイルにアクセスするステップと
をさらに含むことを特徴とする付記1に記載の方法。
付記5.前記第1の層及び前記第2の層のデータユニットがデジタルサンプルを含み、前記結合するステップが、
マッチング同期化情報を有する前記第1の層内のデジタルサンプル及び前記第2の層内のデジタルサンプルを特定するステップを含むことを特徴とする付記1に記載の方法。
付記6.前記第2の層のデータユニットは、メディアコンテナファイル内に含まれていることを特徴とする付記1に記載の方法。
付記7.前記メディアコンテナファイルは、MP4ファイルであることを特徴とする付記6に記載の方法。
付記8.前記第1の層のデータユニットは、リアルタイムプロトコルに従ったパケットのストリーム内で伝送されることを特徴とする付記1に記載の方法。
付記9.前記デジタルビデオ信号がスケーラブルビデオコーディングに従ってエンコーディングされ、前記第1の層はベース層であり、前記第2の層はエンハンスメント層であることを特徴とする付記1に記載の方法。
付記10.前記ベース層は標準解像度ビデオを伝送し、前記エンハンスメント層は高解像度ビデオを伝送することを特徴とする付記9に記載の方法。
付記11.第1の層及び第2の層において伝送されるエンコーディングされたデジタルビデオ信号を再生する装置であって、前記第2の層は、前記第1の層の解像度、フレームレート及び品質のうちの少なくとも1つを向上させる情報を含み、前記装置が、
前記第1の層及び前記第2の層のデータユニットを受信する受信器と、
前記第2の層の当該受信されたデータユニットを保存するメモリと、
前記第1の層の更なるデータユニットを受信する間、前記第1の層のデータユニットを前記第2の層の対応するデータユニットに結合する結合器であって、前記第2の層のデータユニットは、前記第1の層の対応するデータユニットが受信される前に受信されかつ保存される、結合器と、
前記結合されたデータユニットをデコーディングすることによって出力ビデオフレームを生成するデコーダと
を含むことを特徴とする装置。
付記12.当該結合されたデータユニットのデコーディングが許可されているとインジケータが示している場合に、前記第2の層のデータユニットが保存されることを特徴とする付記11に記載の装置。
付記13.ユーザインプットを受信して、前記結合されたデータユニットのデコーディングの許可または前記結合されたデータユニットのデコーディングの不許可のうちの1つに前記インジケータを設定するインタフェースをさらに含むことを特徴とする付記12に記載の装置。
付記14.前記第1の層のデータユニットの受信に応答して前記第2の層の当該保存されたデータユニットを含むファイルを特定しかつ前記第2の層のデータユニットを検索するために前記ファイルにアクセスするファイルリーダをさらに含むことを特徴とする付記11に記載の装置。
付記15.前記第1の層及び前記第2の層のデータユニットがデジタルサンプルを含み、前記装置が、
マッチング同期化情報を有する前記第1の層内のデジタルサンプル及び前記第2の層内のデジタルサンプルを特定する同期化器を含むことを特徴とする付記11に記載の装置。
付記16.前記第2の層のデータユニットは、メディアコンテナファイル内に含まれることを特徴とする付記11に記載の装置。
付記17.前記メディアコンテナファイルは、MP4ファイルであることを特徴とする付記16に記載の装置。
付記18.前記第1の層のデータユニットが、リアルタイムプロトコルに従ったパケットのストリームで前記受信器に伝送されることを特徴とする付記11に記載の装置。
付記19.前記デジタルビデオ信号がスケーラブルビデオコーディングに従ってエンコーディングされ、前記第1の層がベース層であり、前記第2の層がエンハンスメント層であることを特徴とする付記11に記載の装置。
付記20.前記ベース層が標準解像度ビデオを伝送し、前記エンハンスメント層が高解像度ビデオを伝送することを特徴とする付記19に記載の装置。
付記21.第1の層及び第2の層において伝送されるエンコーディングされたデジタルビデオ信号を再生する装置であって、前記第2の層が前記第1の層の解像度、フレームレート及び品質のうちの少なくとも1つを向上させる情報を含み、前記装置が、
第2の層のデータユニットを受信する手段と、
前記第2の層の当該受信されたデータユニットを保存する手段と、
前記第2の層のデータユニットに対応する前記第1の層のデータユニットを受信する手段と、
前記第1の層の更なるデータユニットを受信する間、前記第1の層のデータユニットと前記第2の層の対応するデータユニットとを結合する手段であって、前記第2の層のデータユニットが、前記第1の層の対応するデータユニットが受信される前に、受信されかつ保存される、手段と、
前記結合されたデータユニットをデコーディングすることによって出力ビデオフレームを生成する手段と
を含むことを特徴とする装置。
付記22.前記結合されたデータユニットのデコーディングが許可されているとインジケータが示している場合に、前記第2の層のデータユニットが保存されることを特徴とする付記21に記載の装置。
付記23.ユーザ入力を受信して、前記結合されたデータユニットのデコーディングの許可または前記結合されたデータユニットのデコーディングの不許可のうちの1つに前記インジケータを設定する手段をさらに含むことを特徴とする付記22に記載の装置。
付記24.前記第1の層のデータユニットの受信に応答して前記第2の層の前記保存されたデータユニットを含むファイルを特定しかつ前記第2の層のデータユニットを検索するために前記ファイルにアクセスする手段をさらに含むことを特徴とする付記21に記載の装置。
付記25.前記第1の層及び前記第2の層のデータユニットがデジタルサンプルを含み、前記装置が、
マッチング同期化情報を有する前記第1の層内のデジタルサンプル及び前記第2の層内のデジタルサンプルを特定する手段を含むことを特徴とする付記21に記載の装置。
付記26.前記第2の層のデータユニットがメディアコンテナファイル内に含まれていることを特徴とする付記21に記載の装置。
付記27.前記メディアコンテナファイルがMP4ファイルであることを特徴とする付記26に記載の装置。
付記28.前記第1の層のデータユニットがリアルタイムプロトコルに従ったパケットのストリームで伝送されることを特徴とする付記21に記載の装置。
付記29.前記デジタルビデオ信号が、スケーラブルビデオコーディングに従ってエンコーディングされ、前記第1の層がベース層であり、前記第2の層がエンハンスメント層であることを特徴とする付記21に記載の装置。
付記30.前記ベース層が標準解像度ビデオを伝送し、前記エンハンスメント層が高解像度ビデオを伝送することを特徴とする付記29に記載の装置。
図1
図2
図3A
図3B
図3C
図4
図5
図6