(19)【発行国】日本国特許庁(JP)
(12)【公報種別】特許公報(B2)
(11)【特許番号】6040282
(24)【登録日】2016年11月11日
(45)【発行日】2016年12月7日
(54)【発明の名称】拡張されたビデオストリームを復号するための方法および装置
(51)【国際特許分類】
H04N 19/30 20140101AFI20161128BHJP
【FI】
H04N19/30
【請求項の数】35
【全頁数】20
(21)【出願番号】特願2015-95098(P2015-95098)
(22)【出願日】2015年5月7日
(62)【分割の表示】特願2013-76263(P2013-76263)の分割
【原出願日】2009年3月4日
(65)【公開番号】特開2015-144493(P2015-144493A)
(43)【公開日】2015年8月6日
【審査請求日】2015年6月8日
(31)【優先権主張番号】61/034,370
(32)【優先日】2008年3月6日
(33)【優先権主張国】US
(31)【優先権主張番号】12/395,056
(32)【優先日】2009年2月27日
(33)【優先権主張国】US
(73)【特許権者】
【識別番号】500234493
【氏名又は名称】アリス テクノロジー インコーポレイテッド
【氏名又は名称原語表記】ARRIS TECHNOLOGY, INC.
(74)【代理人】
【識別番号】100105957
【弁理士】
【氏名又は名称】恩田 誠
(74)【代理人】
【識別番号】100068755
【弁理士】
【氏名又は名称】恩田 博宣
(72)【発明者】
【氏名】ナラシマン、マンダヤム エイ.
【審査官】
堀井 啓明
(56)【参考文献】
【文献】
国際公開第2005/050346(WO,A2)
【文献】
特表2001−500674(JP,A)
【文献】
特開2009−010649(JP,A)
【文献】
特開2007−266748(JP,A)
【文献】
米国特許出願公開第2007/0230564(US,A1)
【文献】
特表2009−531999(JP,A)
(58)【調査した分野】(Int.Cl.,DB名)
H04N19/00−19/98
(57)【特許請求の範囲】
【請求項1】
基本層ビデオアクセスユニットと拡張層ビデオアクセスユニットとから構成された拡張ビデオストリームを復号する方法において、各アクセスユニットは複数のシンタックス構造を含み、前記方法は、
基本層アクセスユニットのシンタックス構造を基本層バッファに渡す工程と、
拡張層アクセスユニットのシンタックス構造を拡張層バッファに渡す工程と、
基本層バッファに渡されたシンタックス構造を所定のシーケンスにより出力する工程と、
拡張層バッファに渡されたシンタックス構造を所定のシーケンスにより出力する工程と、
基本層バッファおよび拡張層バッファによってそれぞれ出力されたシンタックス構造のシーケンスを再結合し、基本層シンタックス構造および拡張層シンタックス構造を所定のシーケンスで含む、完全な拡張アクセスユニットを形成する工程と、を含む方法。
【請求項2】
拡張ビデオストリームは、基本層アクセスユニットおよび1つ以上の拡張層アクセスユニットを各々含む、一連の拡張アクセスユニットから構成されており、該一連の拡張アクセスユニットから基本層アクセスユニットのシンタックス構造を分離する工程を含む、請求項1に記載の方法。
【請求項3】
拡張層アクセスユニットのシンタックス構造はビデオ層シンタックス構造および非ビデオ層シンタックス構造を含み、前記一連の拡張アクセスユニットから基本層アクセスユニットのシンタックス構造を分離する工程は、前記一連の拡張アクセスユニットから拡張層アクセスユニットの非ビデオ層シンタックス構造を分離する工程であって、それによって、基本層バッファに渡されるシンタックス構造が拡張層非ビデオシンタックス構造を含む工程を含み、拡張層アクセスユニットのビデオ層シンタックス構造は全て拡張層バッファに渡される、請求項2に記載の方法。
【請求項4】
前記一連の拡張アクセスユニットにおける拡張層アクセスユニットのシンタックス構造は、ビデオ層シンタックス構造と、非ビデオ層シンタックス構造と、アクセスユニットのビデオ層シンタックス構造の境界を示す区切シンタックス構造とを含み、ユニタリな一連
の拡張アクセスユニットから基本層アクセスユニットのシンタックス構造を分離する工程は、区切シンタックス構造より前のシンタックス構造を基本層バッファに渡し、区切シンタックス構造より後のシンタックス構造を拡張層バッファに渡す工程を含む、請求項2に記載の方法。
【請求項5】
異なるそれぞれのプログラム識別子とともに、基本層アクセスユニットのシンタックス構造および残りのシンタックス構造を運ぶ、多重化トランスポートストリームを受信する工程と、前記異なるそれぞれのプログラム識別子に基づき、前記多重化トランスポートストリームを脱多重化して2つ以上のプログラムストリームを生成する工程と、前記2つのプログラムストリームを基本層バッファと拡張層バッファとにそれぞれ渡す工程と、を含む請求項1に記載の方法。
【請求項6】
基本層バッファは1つのエレメンタリストリーム・バッファセグメントを含み、拡張層バッファは1つのエレメンタリストリーム・バッファセグメントを含み、前記エレメンタリストリーム・バッファセグメントの結合したサイズを動的に調整し、基本層バッファのエレメンタリストリーム・バッファセグメントの最大サイズを制限しつつ、拡張ビデオストリームの復号を最適化する工程を含む、請求項1に記載の方法。
【請求項7】
完全な拡張アクセスユニットをビデオデコーダへ渡す工程を含む、請求項1に記載の方法。
【請求項8】
拡張層アクセスユニットは少なくとも第1および第2の拡張層のシンタックス構造を含み、残りのシンタックス構造を拡張層バッファに渡す工程は、第1および第2の拡張層のシンタックス構造をそれぞれ第1および第2の拡張層バッファに渡す工程を含む、請求項1に記載の方法。
【請求項9】
拡張ビデオストリームは、基本層アクセスユニットおよび少なくとも第1および第2の拡張層アクセスユニットを各々含む、一連の拡張アクセスユニットから構成されており、該一連の拡張アクセスユニットから基本層アクセスユニットのシンタックス構造を分離する工程を含む、請求項8に記載の方法。
【請求項10】
各拡張層アクセスユニットのシンタックス構造はビデオ層シンタックス構造および非ビデオ層シンタックス構造を含み、前記一連の拡張アクセスユニットから基本層アクセスユニットのシンタックス構造を分離する工程は、前記一連の拡張アクセスユニットから第1および第2の拡張層アクセスユニットの非ビデオ層シンタックス構造を分離する工程であって、それによって、基本層バッファに渡されるシンタックス構造が拡張層非ビデオシンタックス構造を含む工程を含み、第1および第2の拡張層アクセスユニットのビデオ層シンタックス構造は全てそれぞれ第1および第2の拡張層バッファに渡される、請求項9に記載の方法。
【請求項11】
前記一連の拡張アクセスユニットにおける拡張層アクセスユニットのシンタックス構造は、ビデオ層シンタックス構造と、非ビデオ層シンタックス構造と、アクセスユニットのビデオ層シンタックス構造の境界を示す区切シンタックス構造とを含み、ユニタリな一連の拡張アクセスユニットから基本層アクセスユニットのシンタックス構造を分離する工程は、区切シンタックス構造より前のシンタックス構造を基本層バッファに渡し、区切シンタックス構造より後のシンタックス構造を拡張層バッファに渡す工程を含む、請求項9に記載の方法。
【請求項12】
第1のプログラム識別子とともに基本層アクセスユニットのシンタックス構造を運び、第2のプログラム識別子とともに第1の拡張層のシンタックス構造を運び、かつ、第3の
プログラム識別子とともに第2の拡張層のシンタックス構造を運ぶ、多重化トランスポートストリームを受信する工程と、第1、第2、および第3のプログラム識別子にそれぞれ基づき、前記多重化トランスポートストリームを脱多重化して少なくとも第1、第2、および第3のプログラムストリームを生成する工程と、第1、第2、および第3のプログラムストリームをそれぞれ基本層バッファ、第1の拡張層バッファ、および第2の拡張層バッファに渡す工程と、を含む請求項8に記載の方法。
【請求項13】
基本層バッファは1つのエレメンタリストリーム・バッファセグメントを含み、第1および第2の拡張層バッファはそれぞれ第1および第2のエレメンタリストリーム・バッファセグメントを含み、前記エレメンタリストリーム・バッファセグメントの結合したサイズを動的に調整し、基本層バッファのエレメンタリストリーム・バッファセグメントの最大サイズを制限しつつ、拡張ビデオストリームの復号を最適化する工程を含む、請求項8に記載の方法。
【請求項14】
完全な拡張アクセスユニットをビデオデコーダへ渡す工程を含む、請求項8に記載の方法。
【請求項15】
拡張されたビデオ信号を生成する方法において、
基本層ビデオアクセスユニットと拡張層ビデオアクセスユニットとから構成されたユニタリ・ビットストリームを受信する工程と、
ユニタリ・ビットストリームから基本層プログラムストリームおよび拡張層プログラムストリームを分離する工程と、
拡張層プログラムストリームに区切シンタックス構造を挿入する工程と、を含む方法。
【請求項16】
拡張されたビデオ信号を生成する方法において、
基本層ビデオアクセスユニットと拡張層ビデオアクセスユニットとから構成されたユニタリ・ビットストリームを受信する工程であって、各拡張層アクセスユニットはビデオ層シンタックス構造および非ビデオ層シンタックス構造を含む工程と、
ユニタリ・ビットストリームから基本層プログラムストリームおよび拡張層プログラムストリームを分離する工程と、
拡張層アクセスユニットの非ビデオ層シンタックス構造を基本層プログラムストリームに含める工程であって、それによって、拡張されたビデオ信号は、拡張層アクセスユニットの非ビデオ層シンタックス構造を含む基本層コンポーネントと、拡張層アクセスユニットのビデオ層シンタックス構造を含む拡張層コンポーネントとを含む工程と、を含む方法。
【請求項17】
拡張ビデオストリームの一連の基本層アクセスユニットを運ぶ基本層プログラムストリームと、該拡張ビデオストリームの一連の拡張層アクセスユニットを運ぶ1つ以上の拡張層プログラムストリームとを復号するための復号装置において、各アクセスユニットは複数のシンタックス構造を含み、前記復号装置は、
基本層プログラムストリームを受信して、各基本層アクセスユニットのシンタックス構造を所定のシーケンスにより出力するように接続されている基本層バッファと、
拡張層プログラムストリームを受信して、各拡張層アクセスユニットのシンタックス構造を所定のシーケンスにより出力するように接続されている拡張層バッファと、
基本層バッファおよび拡張層バッファによってそれぞれ出力されるシンタックス構造を受信して、基本層シンタックス構造および拡張層シンタックス構造を所定のシーケンスで含む、完全な拡張アクセスユニットを形成するように接続されている再アセンブリ機能部と、を備える復号装置。
【請求項18】
完全な拡張アクセスユニットを受信するように接続されているビデオデコーダであって
、拡張アクセスユニットを復号してビデオ表現ユニットを形成するように動作するビデオデコーダをさらに備える、請求項17に記載の復号装置。
【請求項19】
基本層プログラムストリームおよび拡張層プログラムストリームは、トランスポートストリームによりカプセル化されており、前記復号装置は、トランスポートストリームを受信し、基本層プログラムストリームと拡張層プログラムストリームとを分離して出力するためのトランスポートストリーム・デマルチプレクサを備える、請求項17に記載の復号装置。
【請求項20】
各拡張層アクセスユニットに含まれるシンタックス構造はビデオ符号化層拡張層アクセスユニットを含み、トランスポートストリームによりカプセル化された拡張層プログラムストリームの各拡張層アクセスユニットは、該拡張層アクセスユニットに含まれるビデオ符号化層アクセスユニットの境界を示す区切シンタックス構造を運び、前記トランスポートストリーム・デマルチプレクサは、区切アクセスユニットに基づきトランスポートストリームから拡張層アクセスユニットを抽出する、請求項19に記載の復号装置。
【請求項21】
拡張されたビデオ信号を生成するための装置において、基本層アクセスユニットと拡張層アクセスユニットとから構成されたユニタリ・ビットストリームを受信するための入力を有し、ユニタリ・ビットストリームから基本層プログラムストリームおよび拡張層プログラムストリームを分離するための分離器と、拡張層プログラムストリームに区切シンタックス構造を挿入するための挿入器と、を備える装置。
【請求項22】
拡張されたビデオ信号を生成するための装置において、基本層アクセスユニットと拡張層アクセスユニットとから構成されたユニタリ・ビットストリームを受信するための入力を有し、各拡張層アクセスユニットはビデオ層シンタックス構造および非ビデオ層シンタックス構造を含み、ユニタリ・ビットストリームから基本層プログラムストリームおよび拡張層プログラムストリームを分離することと、拡張層アクセスユニットの非ビデオ層シンタックス構造を基本層プログラムストリームに含めることによって、拡張されたビデオ信号は、拡張層アクセスユニットの非ビデオ層シンタックス構造を含む基本層コンポーネントと、拡張層アクセスユニットのビデオ層シンタックス構造を含む拡張層コンポーネントとを含むこととのための分離器を備える装置。
【請求項23】
基本層アクセスユニットおよび拡張層アクセスユニットを運ぶ拡張ビデオストリームを受信するための入力を有するコンピュータによって実行されたときに1つの方法によってビデオストリームを処理するソフトウェアを含むコンピュータ可読媒体において、各アクセスユニットは複数のシンタックス構造を含み、前記方法は、
基本層アクセスユニットのシンタックス構造を基本層バッファに渡す工程と、
拡張層アクセスユニットのシンタックス構造を拡張層バッファに渡す工程と、
基本層バッファに渡されたシンタックス構造を所定のシーケンスにより出力する工程と、
拡張層バッファに渡されたシンタックス構造を所定のシーケンスにより出力する工程と、
基本層バッファおよび拡張層バッファによってそれぞれ出力されたシンタックス構造のシーケンスを再結合し、基本層シンタックス構造および拡張層シンタックス構造を所定のシーケンスで含む、完全な拡張アクセスユニットを形成する工程と、を含む、コンピュータ可読媒体。
【請求項24】
基本層アクセスユニットと拡張層アクセスユニットとから構成されたユニタリ・ビットストリームを受信するための入力を有するコンピュータによって実行されたときに1つの方法によってビデオストリームを処理するソフトウェアを含むコンピュータ可読媒体にお
いて、前記方法は、
ユニタリ・ビットストリームから基本層プログラムストリームおよび拡張層プログラムストリームを分離する工程と、
拡張層プログラムストリームに区切シンタックス構造を挿入する工程と、を含む、コンピュータ可読媒体。
【請求項25】
基本層アクセスユニットと拡張層アクセスユニットとから構成されたユニタリ・ビットストリームを受信するための入力を有するコンピュータによって実行されたときに1つの方法によってビデオストリームを処理するソフトウェアを含むコンピュータ可読媒体において、各拡張層アクセスユニットはビデオ層シンタックス構造および非ビデオ層シンタックス構造を含み、前記方法は、
ユニタリ・ビットストリームから基本層プログラムストリームおよび拡張層プログラムストリームを分離する工程と、
拡張層アクセスユニットの非ビデオ層シンタックス構造を基本層プログラムストリームに含める工程であって、それによって、拡張されたビデオ信号は、拡張層アクセスユニットの非ビデオ層シンタックス構造を含む基本層コンポーネントと、拡張層アクセスユニットのビデオ層シンタックス構造を含む拡張層コンポーネントとを含む工程と、を含む、コンピュータ可読媒体。
【請求項26】
拡張されたビデオ信号を生成する方法であって、前記方法は、
複数のパケット化エレメンタリストリームにより、基本層アクセスユニットと拡張層アクセスユニットとを運ぶユニタリ・ビットストリームを受信する工程であって、各拡張層アクセスユニットはビデオ層シンタックス構造および非ビデオ層シンタックス構造を含む工程と、
ユニタリ・ビットストリームから基本層プログラムストリームおよび拡張層プログラムストリームを分離する工程と、
前記拡張層アクセスユニットの非ビデオ層シンタックス構造を前記基本層プログラムストリームに含める工程であって、それによって、拡張されたビデオ信号は、前記拡張層アクセスユニットの非ビデオ層シンタックス構造を含む基本層コンポーネントと、前記拡張層アクセスユニットのビデオ層シンタックス構造を含む拡張層コンポーネントとを含む工程と
を有し、
前記拡張層コンポーネントは、前記拡張層アクセスユニットの非ビデオ層シンタックス構造を含まない、方法。
【請求項27】
拡張されたビデオ信号を生成するための装置であって、前記装置は、
複数のパケット化エレメンタリストリームにより、基本層アクセスユニットと拡張層アクセスユニットとを運ぶユニタリ・ビットストリームを受信するための入力アダプタに通信可能に接続された少なくとも1つのプロセッサを備え、各拡張層アクセスユニットは、ビデオ層シンタックス構造および非ビデオ層シンタックス構造を含み、
前記少なくとも1つのプロセッサは、分離器を提供するように構成され、
前記分離器は、前記ユニタリ・ビットストリームから基本層プログラムストリームおよび拡張層プログラムストリームを分離し、前記拡張層アクセスユニットの非ビデオ層シンタックス構造を、前記基本層プログラムストリームに含め、それによって、拡張されたビデオ信号は、前記拡張層アクセスユニットの非ビデオ層シンタックス構造を含む基本層コンポーネントと、前記拡張層アクセスユニットのビデオ層シンタックス構造を含む拡張層コンポーネントとを含み、それによって前記拡張層コンポーネントは、前記拡張層アクセスユニットの非ビデオシンタックス構造を含まない、装置。
【請求項28】
記憶されたソフトウェア命令を含む非一時的なコンピュータ可読媒体において、該記憶
されたソフトウェア命令が、複数のパケット化エレメンタリストリームにより、基本層アクセスユニットと拡張層アクセスユニットとを運ぶユニタリ・ビットストリームであって各拡張層アクセスユニットはビデオ層シンタックス構造および非ビデオ層シンタックス構造を含むユニタリ・ビットストリームを受信するための入力を有するコンピュータの1つ以上のプロセッサによって実行されたとき、該1つ以上のプロセッサは拡張されたビデオ信号を生成するべく、
前記ユニタリ・ビットストリームから基本層プログラムストリームおよび拡張層プログラムストリームを分離する工程と、
拡張層アクセスユニットの非ビデオ層シンタックス構造を基本層プログラムストリームに含める工程であって、それによって、拡張されたビデオ信号は、前記拡張層アクセスユニットの非ビデオ層シンタックス構造を含む基本層コンポーネントと、前記拡張層アクセスユニットのビデオ層シンタックス構造を含む拡張層コンポーネントとを含み、前記拡張層コンポーネントは、前記拡張層アクセスユニットの非ビデオシンタックス構造を含まない工程と
を行うように動作する、コンピュータ可読媒体。
【請求項29】
前記拡張層プログラムストリームに区切シンタックス構造を挿入する工程を含む、請求項28に記載のコンピュータ可読媒体。
【請求項30】
前記拡張層プログラムストリームに区切シンタックス構造を挿入する工程を含む、請求項26に記載の方法。
【請求項31】
基本層コンポーネントと1つ以上の拡張層コンポーネントとを含むビデオ信号を生成する方法であって、
複数のパケット化エレメンタリストリームにより、複数のアクセスユニットを運ぶビットストリームを受信する工程であって、前記複数のアクセスユニットは基本層アクセスユニットと拡張層アクセスユニットとを含み、各拡張層アクセスユニットはビデオ層シンタックス構造および非ビデオ層シンタックス構造を含む、工程と、
ビットストリームを複数のビデオサブビットストリームに分離する工程であって、前記複数のビデオサブビットストリームは基本層プログラムストリームおよび拡張層プログラムストリームを含む、工程と、
前記基本層アクセスユニットと前記拡張層アクセスユニットの非ビデオ層シンタックス構造とを、ビデオ信号の再アセンブリされる基本層プログラムストリームに含める工程と、
前記拡張層アクセスユニットのビデオ層シンタックス構造を、前記1つ以上の拡張層コンポーネントに含める工程と、
前記拡張層アクセスユニットの非ビデオ層シンタックス構造を、前記1つ以上の拡張層コンポーネントから除く工程と、
前記ビデオ信号を生成するように前記複数のアクセスユニットを再アセンブリされる工程であって、前記ビデオ信号の基本層コンポーネントは前記拡張層アクセスユニットの非ビデオ層シンタックス構造を含み、前記ビデオ信号の前記1つ以上の拡張層コンポーネントは前記拡張層アクセスユニットの非ビデオ層シンタックス構造を含まない、工程と、を備える方法。
【請求項32】
前記ビデオ信号をデコーダに提供する工程をさらに備える、請求項31に記載の方法。
【請求項33】
基本層コンポーネントと1つ以上の拡張層コンポーネントとを含むビデオ信号を生成するための装置であって、
複数のパケット化エレメンタリストリームにより、複数のアクセスユニットを運ぶビットストリームを受信する工程であって、前記複数のアクセスユニットは基本層アクセスユ
ニットと拡張層アクセスユニットとを含み、各拡張層アクセスユニットはビデオ層シンタックス構造および非ビデオ層シンタックス構造を含む、工程を実行するための入力アダプタに通信可能に接続されている1つ以上のプロセッサを備え、
前記1つ以上のプロセッサは、ビットストリームを複数のビデオサブビットストリームに分離する工程であって、前記複数のビデオサブビットストリームは基本層プログラムストリームおよび拡張層プログラムストリームを含む、工程を実行するための分離器を提供するように構成されており、
前記1つ以上のプロセッサは、
前記基本層アクセスユニットと前記拡張層アクセスユニットの非ビデオ層シンタックス構造とを、ビデオ信号の再アセンブリされる基本層プログラムストリームに含める工程と、
前記拡張層アクセスユニットのビデオ層シンタックス構造を、前記1つ以上の拡張層コンポーネントに含める工程と、
前記拡張層アクセスユニットの非ビデオ層シンタックス構造を、前記1つ以上の拡張層コンポーネントから除く工程と、
前記ビデオ信号を生成するように前記複数のアクセスユニットを再アセンブリされる工程であって、前記ビデオ信号の基本層コンポーネントは前記拡張層アクセスユニットの非ビデオ層シンタックス構造を含み、前記拡張層アクセスユニットの非ビデオ層シンタックス構造を含まない、工程と、を実行するようにさらに構成されている、装置。
【請求項34】
前記1つ以上のプロセッサは、前記1つ以上のプロセッサに通信可能に接続されているデコーダに前記ビデオ信号を提供する工程を実行するようにさらに構成されている、請求項33に記載の装置。
【請求項35】
記憶されたソフトウェア命令を含む非一時的なコンピュータ可読媒体において、該記憶されたソフトウェア命令が、複数のパケット化エレメンタリストリームにより、複数のアクセスユニットであって基本層アクセスユニットと拡張層アクセスユニットとを含み各拡張層アクセスユニットはビデオ層シンタックス構造および非ビデオ層シンタックス構造を含む複数のアクセスユニットを運ぶビットストリームを受信するための入力を有するコンピュータの1つ以上のプロセッサによって実行されたとき、該1つ以上のプロセッサはデオ信号を生成するべく、
複数のパケット化エレメンタリストリームにより、複数のアクセスユニットを運ぶビットストリームを受信する工程であって、前記複数のアクセスユニットは基本層アクセスユニットと拡張層アクセスユニットとを含み、各拡張層アクセスユニットはビデオ層シンタックス構造および非ビデオ層シンタックス構造を含む、工程と、
ビットストリームを複数のビデオサブビットストリームに分離する工程であって、前記複数のビデオサブビットストリームは基本層プログラムストリームおよび拡張層プログラムストリームを含む、工程と、
前記基本層アクセスユニットと前記拡張層アクセスユニットの非ビデオ層シンタックス構造とを、ビデオ信号の再アセンブリされる基本層プログラムストリームに含める工程と、
前記拡張層アクセスユニットのビデオ層シンタックス構造を、前記1つ以上の拡張層コンポーネントに含める工程と、
前記拡張層アクセスユニットの非ビデオ層シンタックス構造を、前記1つ以上の拡張層コンポーネントから除く工程と、
前記ビデオ信号を生成するように前記複数のアクセスユニットを再アセンブリされる工程であって、前記ビデオ信号の基本層コンポーネントは前記拡張層アクセスユニットの非ビデオ層シンタックス構造を含み、前記拡張層アクセスユニットの非ビデオ層シンタックス構造を含まない、工程と、
を行うように動作する、コンピュータ可読媒体。
【発明の詳細な説明】
【技術分野】
【0001】
本発明は、拡張ビデオストリームを復号するための方法および装置に関する。
【背景技術】
【0002】
図面の
図1を参照する。ビデオエンコーダ10は、カメラなどのソースから、生ビデオデータ(通常、SMPTE−292Mにおいて規定されたHD−SDIフォーマットである)を受信する。ビデオエンコーダは、HD−SDIデータを利用してビデオ・エレメンタリストリームを生成するとともに、ビデオ・エレメンタリストリームをビデオパケット化器14に供給する。ビデオパケット化器14は、様々な長さのパケットから構成されたビデオパケット化エレメンタリストリーム(PES)を生成する。通常、ビデオPESの各パケットは、1つ以上のビデオフレームを含んでいる。同様に、オーディオエンコーダ(図示せず)は、例えば、マイクロホンから生オーディオデータを受信して、オーディオパケット化器にオーディオ・エレメンタリストリームを供給し、オーディオパケット化器は、様々な長さのパケットから構成されたオーディオPESを生成する。
【0003】
ビデオおよびオーディオパケット化器はトランスポートストリーム・マルチプレクサ18にビデオおよびオーディオPESを供給する。トランスポートストリーム・マルチプレクサ18は、ビデオPESおよびオーディオPESにそれぞれ異なるプログラム識別子(PID)を割り当て、ビデオおよびオーディオPESの可変長パケットを、PESのPIDを含むヘッダとPESビデオ(またはオーディオ)データを含むペイロードとを各々有する、固定長のMPEG−2・トランスポートストリーム(TS)パケットに編成する。
【0004】
トランスポートストリーム・マルチプレクサによって出力されるシングルプログラム・トランスポートストリーム(SPTS)は、プログラム・マルチプレクサ22に供給される場合がある。プログラム・マルチプレクサ22は、SPTSを他のプログラムを運ぶ他のトランスポートストリームと結合し、マルチプログラム・トランスポートストリーム(MPTS)を生成する。MPTSはチャネルを通じて受信器に送信され、受信器において、プログラム・デマルチプレクサ26は選択されたSPTSをMPTSから分離し、それをトランスポートストリーム・デマルチプレクサ30に供給する。トランスポートストリーム・マルチプレクサによって出力されるSPTSは、最初に他のトランスポートストリームと結合してMPTSを生成することなく、トランスポートストリーム・デマルチプレクサに直接送信される場合もあるが、しかしいずれの場合においても、トランスポートストリーム・デマルチプレクサは、選択されたSPTSのトランスポートストリーム・パケットを受信して、それらをPIDに基づき分離し、トランスポートストリーム・パケットを分解(depacketize)してPESパケットを再生成し、いわゆるビデオ・システムターゲットデコーダ(T−STD)34にビデオPESを宛て、オーディオT−STD38にオーディオPESを宛てることが当業者には認められる。本出願の主題はビデオビットストリームの復号に関するので、オーディオデコーダについてさらには説明しない。
【0005】
ビデオT−STD34は、システムターゲットデコーダ・バッファ40およびビデオデコーダ42を備える。STDバッファ40は、トランスポート・バッファTb、多重化バッファMb、およびエレメンタリストリーム・バッファEbに機能的に等しい。トランスポート・バッファTbは、可変ビットレートでビデオPESを受信し、一定なビットレートで多重化バッファMbにデータを出力する。多重化バッファMbは、ビデオPESを分解し、符号化されたビットストリームを一定なビットレートでエレメンタリストリーム・バッファEbに供給する。エレメンタリストリーム・バッファ(デコーダ・バッファまた
は符号化ピクチャ・バッファ(CPB)と呼ばれることがある)は、CBRビットストリームを受信すると、画像を復号するために、ピクチャ復号時間にビデオデコーダによってビットがすべて直ちに除去されるまで、それらのビットを保持する。
【0006】
デコーダが適切に動作するには、デコーダ・バッファがオーバフロー(ビットが失われ、ピクチャの復号は不可能)やアンダーフロー(デコーダにビットが足りず、適切な時間でピクチャを復号することは不可能)を起こさないことが重要である。デコーダ・バッファに対するビットの供給は、ビデオエンコーダ10からビットストリームを受信する、圧縮データバッファ(CDB)46によって制御される。ビデオエンコーダは、CDBが満たされるのに応じたレートで、CDBにビットを供給する。CDBは一定なレートでビデオパケット化器14にビットを供給し、多重化バッファはその同じレートでデコーダ・バッファにビットを供給するので、したがって、CDBが満たされることは、デコーダ・バッファが満たされることを反映している。CDBのオーバフロー/アンダーフローを防止するようにCDBに対するビットの供給を調節することによって、デコーダ・バッファのアンダーフロー/オーバフローが回避される。
【0007】
エンコーダの動作を支配するビデオ圧縮標準規格は、CDBが仮定的な基準デコーダのデコーダ・バッファより大きくないと指定する場合がある。
MPEG−2トランスポートストリームは、エラーの生じがちなチャネルを通じた符号化ビデオの送達に広く用いられている。また、MPEG−2システム層は、エラーのない環境においてプログラムストリーム(PS)による符号化ビデオの送信を行う。
図1には、ビデオPESについて、ビデオT−STD34に対するトランスポートストリームとしての送達に代わる、ビデオP−STD50に対するプログラムストリームとしての送信を示す。
【0008】
ビデオエンコーダ10によって生成されたビットストリームは、ISO/IEC14496−10(MPEG−4、パート10)AVC(Advanced Video Coding)により指定されるビデオ圧縮標準規格に準拠する場合がある(一般にH.264/AVCと呼ばれる)。H.264/AVCは、フレームまたはフィールドの集合語として、ピクチャを用いる。H.264/AVCでは、アクセスユニットを1組のネットワーク抽象化層(NAL)ユニットとして定義し、アクセスユニットの復号によって復号されたピクチャが常に生じると指定される。AVCエンコーダによって生成されるアクセスユニットのNALユニットは、ピクチャ情報を含むビデオ符号化層(VCL)ユニットであるか、クローズドキャプションおよびタイミングなど他の情報を含む非VCLユニットである。
【0009】
H.264/AVCの補遺Gでは、スケーラブル・ビデオ符号化またはSVCとして知られているH.264/AVCの拡張について規定されている。SVCはAVC基本層にスケーラビリティの拡張を提供し、このスケーラビリティには、空間のスケーラビリティ、時間のスケーラビリティ、SNRのスケーラビリティ、およびビット深度のスケーラビリティが含まれる。SVCエンコーダは、H.264/AVC−コンフォーマント基本層を生成し、その基本層に1つ以上の拡張層によって拡張を追加することが期待される。SVCの特定の実装において用いられる各種のスケーラビリティは、それ自身の拡張層を利用することができる。例えば、生ビデオデータが1920×1088ピクセルのフレームから構成された1080HDとして知られるフォーマットである場合、基本層は、704×480ピクセルのピクチャとして復号可能なアクセスユニットから構成されたサブビットストリームによって運ばれるのに対し、拡張層は、基本層アクセスユニットを拡張層アクセスユニットと組み合わせることによって、適切なデコーダが1920×1088ピクセルのピクチャを提示することを可能とするアクセスユニットから構成されたサブビットストリームによって運ばれる。
【0010】
基本層および1つ以上の拡張層の両方を復号する性能を有するデコーダを本明細書ではSVCデコーダと呼び、拡張層を認識可能でなく、基本層アクセスユニットのみを復号可能、したがってSVC性能を有していないデコーダを、本明細書ではAVCデコーダと呼ぶ。
【0011】
SVCエンコーダによって生成されるアクセスユニットは、上述の基本層NALユニット(簡便のためAVC−NALユニットと呼ばれる場合がある)のみならず、SVC−VCL−NALユニットおよびSVC−非VCL−NALユニット。
図2には、SVC標準規格によって規定されるようなSVCアクセスユニットにおける、AVC−NALユニットおよびSVC−NALユニットのシーケンスを示す。エンコーダが、例えば、2つの拡張層を生成する場合、2つの拡張層における非VCL−NALユニットは
図2に示すシーケンスの隣接したブロック、すなわち、AVC非VCL−NALユニットおよびAVC−VCL−NALユニットを含むブロック間にあり、2つの拡張層におけるSVC−VCL−NALユニットはAVC−VCL−NALユニットを含むブロックの後のシーケンスの隣接したブロックにある。
【0012】
アクセスユニットから基本層NALユニットを抽出するSVCデコーダは、AVC非VCL−NALユニットおよびAVC−VCL−NALユニットのみを選択する。
H.264/AVCでは、5ビットのパラメータであるnalユニット型(nal_unit_type)、すなわち、NUTが指定される。H.264/AVCの下では、AVC−NALユニットはすべて、1〜13の範囲のNUT値を有する。SVCでは、NUT値14,20,15が追加される。しかしながら、5または1に等しいNUTを有するNALユニットの直前の14に等しいNUTを有するNALユニットは、それらのNALユニット(非VCL−NALユニットである)がAVCとの互換性を有し、AVCデコーダによって復号可能であるように、基本層スライスのシグナリングを行う。
【0013】
図3を参照すると、SVCエンコーダ10’は、基本層と、例えば、2つの拡張層ENH1,ENH2とを運ぶ、ユニタリ・ビットストリームを生成する。その性能に応じて、デコーダは、基本層のみを、または基本層および拡張層ENH1を、または基本層ならびに拡張層ENH1,ENH2の両方を受信すること、および復号することを期待する。SVC用のMPEG−2システム標準規格およびユースケースの下では、エンコーダは、3つのビットストリーム(それぞれ基本層のみを、基本層および拡張層ENH1を、基本層ならびに拡張層ENH1,ENH2の両方を、運ぶビットストリーム)を提供することはできず、デコーダの復号可能なビットストリームがいずれであっても、デコーダにビットストリームを選択させることはできない。エンコーダは、別個のビットストリームにより基本層アクセスユニットと各拡張層の一部とを提供する必要がある。NAL分離器48を用いて、NALユニットのNUT値に基づきユニタリ・ビットストリームを3つのサブビットストリームへと分離することによって、原理的には、MPEG−2システム標準規格に準拠することが可能である。1つのサブビットストリームは基本層NALユニットを運ぶ、他の2つのサブビットストリームはそれぞれ、2つの拡張層用のNALユニットを運ぶ。3つのサブビットストリームは、それぞれのビデオパケット化器(一般に14で表す)に渡され、ビデオパケット化器はそれぞれのビデオPESを生成する。3つのビデオPESは、3つのパケット化器の出力を一緒に多重化する目的で、SVC−T−STDに含まれたバッファにT−STDバッファ均等物を含む、トランスポートストリーム・マルチプレクサ18に供給される。マルチプレクサ18は、3つのPESに異なるPIDを割り当てて、3つの層を運ぶトランスポートストリームを出力する。
【先行技術文献】
【特許文献】
【0014】
【特許文献1】米国特許出願公開第2007/0230564号明細書
【発明の概要】
【発明が解決しようとする課題】
【0015】
図1に示すビデオT−STD34は、基本層および拡張層アクセスユニットを再アセンブルし、SVCデコーダによって復号可能な完全なSVCアクセスユニットを生成する性能を提供しないので、
図3に示すトランスポートストリーム・マルチプレクサ18’によって生成されるトランスポートストリームによって運ばれるビットストリームを復号することは不可能である。H.264/AVC標準規格においてもMPEG−2システム標準規格においても、基本層および拡張層アクセスユニットがどのように再アセンブルされるかについて規定されてない。したがって、
図3に示すアーキテクチャには、従来、実用的な用途が欠けていた。
【課題を解決するための手段】
【0016】
開示の主題の第1の態様では、基本層ビデオアクセスユニットと拡張層ビデオアクセスユニットとから構成された拡張ビデオストリームを復号する方法において、各アクセスユニットは複数のシンタックス構造を含む方法、が提供される。この方法は、基本層アクセスユニットのシンタックス構造を基本層バッファに渡す工程と、拡張層アクセスユニットのシンタックス構造を拡張層バッファに渡す工程と、基本層バッファに渡されたシンタックス構造を所定のシーケンスにより出力する工程と、拡張層バッファに渡されたシンタックス構造を所定のシーケンスにより出力する工程と、基本層バッファおよび拡張層バッファによってそれぞれ出力されるシンタックス構造のシーケンスを再結合して、基本層シンタックス構造および拡張層シンタックス構造を所定のシーケンスで含む、完全な拡張アクセスユニットを形成する工程と、を含む。
開示の主題の第2の態様では、拡張されたビデオ信号を生成する方法が提供される。この方法は、基本層ビデオアクセスユニットと拡張層ビデオアクセスユニットとから構成されたユニタリ・ビットストリームを受信する工程と、ユニタリ・ビットストリームから基本層プログラムストリームおよび拡張層プログラムストリームを分離する工程と、拡張層プログラムストリームに区切シンタックス構造を挿入する工程と、を含む。
【0017】
開示の主題の第3の態様では、拡張されたビデオ信号を生成する方法が提供される。この方法は、基本層ビデオアクセスユニットと拡張層ビデオアクセスユニットとから構成されたユニタリ・ビットストリームを受信する工程であって、各拡張層アクセスユニットはビデオ層シンタックス構造および非ビデオ層シンタックス構造を含む工程と、ユニタリ・ビットストリームから基本層プログラムストリームおよび拡張層プログラムストリームを分離する工程と、拡張層アクセスユニットの非ビデオ層シンタックス構造を基本層プログラムストリームに含める工程であって、それによって、拡張されたビデオ信号は、拡張層アクセスユニットの非ビデオ層シンタックス構造を含む基本層コンポーネントと、拡張層アクセスユニットのビデオ層シンタックス構造を含む拡張層コンポーネントとを含む工程と、を含む。
【0018】
開示の主題の第4の態様では、拡張ビデオストリームの一連の基本層アクセスユニットを運ぶ基本層プログラムストリームと、該拡張ビデオストリームの一連の拡張層アクセスユニットを運ぶ1つ以上の拡張層プログラムストリームとを復号するための復号装置が提供される。各アクセスユニットは複数のシンタックス構造を含み、復号装置は、基本層プログラムストリームを受信して、各基本層アクセスユニットのシンタックス構造を所定のシーケンスにより出力するように接続されている基本層バッファと、拡張層プログラムストリームを受信して、各拡張層アクセスユニットのシンタックス構造を所定のシーケンスにより出力するように接続されている拡張層バッファと、基本層バッファおよび拡張層バッファによってそれぞれ出力されるシンタックス構造を受信して、基本層シンタックス構
造および拡張層シンタックス構造を所定のシーケンスで含む、完全な拡張アクセスユニットを形成するように接続されている再アセンブリ機能部と、を備える。
【0019】
開示の主題の第5の態様では、拡張されたビデオ信号を生成するための装置が提供される。この装置は、基本層アクセスユニットと拡張層アクセスユニットとから構成されたユニタリ・ビットストリームを受信するための入力を有し、ユニタリ・ビットストリームから基本層プログラムストリームおよび拡張層プログラムストリームを分離するための分離器と、拡張層プログラムストリームに区切シンタックス構造を挿入するための挿入器と、を備える。
【0020】
開示の主題の第6の態様では、拡張されたビデオ信号を生成するための装置が提供される。この装置は、基本層アクセスユニットと拡張層アクセスユニットとから構成されたユニタリ・ビットストリームを受信するための入力を有し、各拡張層アクセスユニットはビデオ層シンタックス構造および非ビデオ層シンタックス構造を含む。この装置は、さらに、ユニタリ・ビットストリームから基本層プログラムストリームおよび拡張層プログラムストリームを分離するためと、拡張層アクセスユニットの非ビデオ層シンタックス構造を基本層プログラムストリームに含め、それによって、拡張されたビデオ信号は、拡張層アクセスユニットの非ビデオ層シンタックス構造を含む基本層コンポーネントと、拡張層アクセスユニットのビデオ層シンタックス構造を含む拡張層コンポーネントとを含むための分離器と、を備える。
【0021】
開示の主題の第7の態様では、基本層アクセスユニットおよび拡張層アクセスユニットを運ぶ拡張ビデオストリームを受信するための入力を有するコンピュータによって実行されたときに1つの方法によってビデオストリームを処理するソフトウェアを含むコンピュータ可読媒体において、各アクセスユニットは複数のシンタックス構造を含む、コンピュータ可読媒体を提供する。この方法は、基本層アクセスユニットのシンタックス構造を基本層バッファに渡す工程と、拡張層アクセスユニットのシンタックス構造を拡張層バッファに渡す工程と、基本層バッファに渡されたシンタックス構造を所定のシーケンスにより出力する工程と、拡張層バッファに渡されたシンタックス構造を所定のシーケンスにより出力する工程と、基本層バッファおよび拡張層バッファによってそれぞれ出力されるシンタックス構造のシーケンスを再結合して、基本層シンタックス構造および拡張層シンタックス構造を所定のシーケンスで含む、完全な拡張アクセスユニットを形成する工程と、を含む。
【0022】
開示の主題の第8の態様では、基本層アクセスユニットと拡張層アクセスユニットとから構成されたユニタリ・ビットストリームを受信するための入力を有するコンピュータによって実行されたときに1つの方法によってビデオストリームを処理するソフトウェアを含むコンピュータ可読媒体を提供する。この方法は、ユニタリ・ビットストリームから基本層プログラムストリームおよび拡張層プログラムストリームを分離する工程と、拡張層プログラムストリームに区切シンタックス構造を挿入する工程と、を含む。
【0023】
開示の主題の第9の態様では、基本層アクセスユニットと拡張層アクセスユニットとから構成されたユニタリ・ビットストリームを受信するための入力を有するコンピュータによって実行されたときに1つの方法によってビデオストリームを処理するソフトウェアを含むコンピュータ可読媒体において、各拡張層アクセスユニットはビデオ層シンタックス構造および非ビデオ層シンタックス構造を含むコンピュータ可読媒体を提供する。この方法は、ユニタリ・ビットストリームから基本層プログラムストリームおよび拡張層プログラムストリームを分離する工程と、拡張層アクセスユニットの非ビデオ層シンタックス構造を基本層プログラムストリームに含める工程であって、それによって、拡張されたビデオ信号は、拡張層アクセスユニットの非ビデオ層シンタックス構造を含む基本層コンポー
ネントと、拡張層アクセスユニットのビデオ層シンタックス構造を含む拡張層コンポーネントとを含む工程と、を含む。
【図面の簡単な説明】
【0024】
【
図1】プレゼンテーション用の圧縮ビデオマテリアルを供給するための第1のシステムのアーキテクチャの概略ブロック図。
【
図2】基本層および1つの拡張層を有するSVCアクセスユニットの構造を示す図。
【
図3】復号およびプレゼンテーション用の圧縮したSVCビデオマテリアルの送信用のアーキテクチャおよびユースケースの概略ブロック図。
【
図4】プレゼンテーション用の圧縮ビデオマテリアルを供給するための第2のシステムのアーキテクチャの概略ブロック図。
【
図5】プレゼンテーション用の圧縮ビデオマテリアルを供給するための第3のシステムのアーキテクチャの概略ブロック図。
【
図6A】
図5に示すシステムにおける様々な点で生成されたデータユニットの構造を示す図。
【
図6B】
図5に示すシステムにおける様々な点で生成されたデータユニットの構造を示す図。
【
図6C】
図5に示すシステムにおける様々な点で生成されたデータユニットの構造を示す図。
【
図7】
図4および
図5に関連して記載した処理の一部を実装するために用いられ得るコンピュータの概略ブロック図。
【発明を実施するための形態】
【0025】
図4に示すSVCエンコーダ10’は、基本層と1つの拡張層とを運ぶビットストリームを生成する。NAL分離器52は、このビットストリームを、基本層NALユニットおよび拡張層NALユニットをそれぞれ運ぶ2つのサブビットストリームに分け、この2つのサブビットストリームは、基本層ビデオパケット化器140および拡張層ビデオパケット化器141に渡される。
図3に関連して記載したように、2つのパケット化器はそれぞれビデオPESを生成する。トランスポートストリーム・マルチプレクサ54は、2つのPESに異なるPIDを割り当てて、2つの層を運ぶトランスポートストリームを出力する。トランスポートストリーム・マルチプレクサ54は、SVC−T−STDモデルに準拠するT−STDバッファを含む。トランスポートストリームは、SPTSとしてトランスポートストリーム・デマルチプレクサ56に対し直接送信されるか、他のトランスポートストリームと多重化され、プログラム・デマルチプレクサ(図示せず)を介してトランスポートストリーム・デマルチプレクサ56に対しMPTSの一部として供給される。
【0026】
従来のように、トランスポートストリーム・デマルチプレクサ56は、PIDに基づきトランスポートストリーム・パケットを分離し、トランスポートストリーム・パケットを分解してPESパケットを再生成する。このようにして、トランスポートストリーム・デマルチプレクサは、基本層PESおよび拡張層PESの両方や1つ以上のオーディオPESを出力する。
図4に示すように、基本層PESおよび拡張層PESは、ビデオT−STD60に対し供給される。ビデオT−STD60は、基本層T−STDバッファ64および拡張層T−STDバッファ68を含む。基本層T−STDバッファ64は、
図1に示したT−STDバッファ40と同様、トランスポート・バッファTb0および多重化バッファMb0を含む。多重化バッファは、エレメンタリストリーム・バッファセグメントESb0に対し、基本層アクセスユニット(AVC非VCL−NALユニットおよびAVC−VCL−NALユニット)を含む符号化ビットストリームを出力する。バッファセグメントESb0のサイズは、H.264/AVC標準規格において規定されているエレメンタリストリーム・バッファEbのサイズを超えてはならない。
【0027】
また、拡張層T−STDバッファ68は、トランスポート・バッファTb1、多重化バッファMb1、およびエレメンタリストリーム・バッファセグメントESb1も含む。多重化バッファMb0と同様、バッファMb1は、拡張層アクセスユニット(SVC−非VCL−NALユニットおよびSVC−VCL−NALユニット)を含む符号化ビットストリームを出力し、この符号化ビットストリームは、基本層アクセスユニットと適切に組み合わされると、H.264の補遺Gにより規定されているようなSVCアクセスユニットを生成する。
【0028】
バッファセグメントESb0,ESb1の結合したサイズは、基本層および1つの拡張層を有するプログラムを復号するSVCデコーダ用のH.264/AVC標準規格の補遺Gにおいて規定されているエレメンタリストリーム・バッファEbのサイズを超えてはならない。しかしながら、許可される総バッファサイズは、バッファセグメントESb0のサイズがAVCデコーダ用のH.264/AVC標準規格において規定されているエレメンタリストリーム・バッファEbのサイズを超えない限り、デコーダの性能を最適化するようにバッファセグメント間に割り当てられてよい。
【0029】
トランスポートストリーム・デマルチプレクサ56によって受信されるアクセスユニットのNALユニットは、アクセスユニットを復号するために必要な順序になっていない場合もあることが、当業者には認められる。エレメンタリストリーム・バッファセグメント(多重化バッファによって提供される符号化ビットストリームを受信する)は、各アクセスユニットのNALユニットが復号に適切な順序により出力されることを保証する。再アセンブリ機能部Re−Aは、2つのT−STDバッファによってそれぞれ出力されるAVCおよびSVC−NALユニットを受信し、それらのNALユニットを適切なシーケンスにより結合して、
図2に示すSVCアクセスユニット構造を再作成する。再アセンブリ機能部は、それぞれの適切な時間で復号を行うために、SVCデコーダにSVCアクセスユニットを供給する。このようにして、T−STD60は、SVCによってサポートされる拡張を含むピクチャを出力することが可能である。
【0030】
バッファ管理(すなわち、トランスポート・バッファ、多重化バッファ、および結合したエレメンタリストリーム・バッファセグメントのサイズや、バッファ間の転送レート)は、従来のMPEG−2のT−STDにおけるのと同じである。データは、従来のMPEG−2のT−STDモデルにおける多重化バッファからのデータの出力用に指定されたレートでエレメンタリストリーム・バッファセグメントに入り、所与のSVCアクセスユニットの基本層NALユニットおよび拡張層NALユニットの両方が、それぞれのエレメンタリストリーム・バッファセグメントに存在した後、即座に再アセンブリ機能部に対し転送され、そこで結合されて、即座にSVCデコーダに対し転送される。したがって、エレメンタリストリーム・バッファセグメントおよび再アセンブリ機能部は、多重化バッファとSVCデコーダとの間のレイテンシを生じない。
【0031】
トランスポートストリーム・マルチプレクサ54によって出力されるトランスポートストリームは、トランスポートストリーム・デマルチプレクサ30を介してAVC−T−STD34’にも供給される場合がある。トランスポートストリーム・マルチプレクサ30は、基本層PESをトランスポートストリームから分離し、基本層PESをT−STD34’に供給する。拡張層PESがT−STD34’に対して供給されないので、T−STD34’は、基本層アクセスユニットの復号に不要なNALユニットを処理することが必要となることによる負担を受けない。
【0032】
ここで
図5を参照すると、別の実施形態では、SVCエンコーダ10’によって生成されたビットストリームは基本層および2つの拡張層ENH1,ENH2を運ぶ。NAL分
離器52は、NALユニットのNUT値に基づきビットストリームを3つのサブビットストリームに分離するが、
図4の場合と異なり、基本層ビットストリームは、AVC−NALユニットだけでなく、SVC−非VCL−NALユニット(上述のように、AVCに対する互換性を有するNALユニットを含む)も含む。NAL分離器によって生成される基本層ビットストリームは、
図6Aに示す構造を有する。2つの各拡張層サブビットストリームは各々、それぞれのSVCアクセスユニット用のSVC−VCL−NALユニットを含む。また、NAL分離器は、
図6Bに示すように、各拡張層サブビットストリームの各アクセスユニットの開始部に、SVC区切(delim)NALユニットを挿入する。SVC区切NALユニットは非常に小さくすることができ、23または24など、予約済みのNUT値を有する。このSVC区切NALユニットは、MPEG−2のシステム標準規格によって定められるように、アクセスユニットデリミタに加え、9に等しいNUTを有する。
【0033】
3つのサブビットストリームがそれぞれパケット化器140,141,142に供給され、パケット化器は、それぞれPESを生成し、そのPESをトランスポートストリーム・マルチプレクサ72に供給する。トランスポートストリーム・マルチプレクサ72(SVC−T−STDモデルに準拠するバッファを含む)は、この3つのPESに対し異なるPIDを割り当て、3つの層を運ぶ1つのトランスポートストリームを出力する。基本層PESは、基本層アクセスユニットを復号するのに必要なAVC−NALユニットを全て含むことが認められる。
【0034】
トランスポートストリーム・マルチプレクサ72によって生成されたトランスポートストリームは、トランスポートストリーム復号機能部74に対し供給される。トランスポートストリーム復号機能部は、トランスポートストリーム・デマルチプレクサ76を含み、トランスポートストリーム・デマルチプレクサ76は、PIDに基づき基本層PESおよび2つの拡張層PESを分離して、それぞれのT−STDバッファ80,81,82に対しそれらを供給する。各T−STDバッファは、トランスポート・バッファTb、多重化バッファMb、およびエレメンタリストリーム・バッファセグメントESbを含む。バッファセグメントESb0,ESb1,ESb2の結合したサイズは、基本層および2つの拡張層を有するプログラムを復号するSVCデコーダ用のH.264/AVC標準規格の補遺Gにおいて規定されているエレメンタリストリーム・バッファEbのサイズを超えてはならない。しかしながら、許可される総バッファサイズは、バッファセグメントESb0,ESb1の結合したサイズが、基本層および1つの拡張層を有するプログラムを復号するSVCデコーダ用のH.264/AVC標準規格の補遺Gにおいて規定されているエレメンタリストリーム・バッファEbのサイズを超えず、バッファセグメントESb0のサイズが、AVCデコーダ用のH.264/AVC標準規格において規定されているエレメンタリストリーム・バッファEbのサイズを超えない限り、デコーダの性能を最適化するようにバッファセグメント間に割り当てられてよい。
【0035】
各T−STDバッファは、
図4に関連して記載したのと同様にして受信したビットストリームを、バッファDRB0が
図6Aに示す構造を有するアクセスユニットを出力し、バッファDRB1およびDRB2が各々
図6Bに示す構造を有するアクセスユニットを出力するように、処理する。バッファ構造の出力は、
図6Cに示す各アクセスユニットについてのNALユニットのシーケンスを生成するように、再アセンブリ機能部Re−Aによって連結される。再アセンブリ機能部の出力は、
図4に関連して記載したように、エレメンタリストリーム・バッファに渡される。
【0036】
図5には、
図4に関連して記載したように、マルチプレクサ54によって出力されるトランスポートストリームがトランスポートストリーム・デマルチプレクサ30を介してAVC−T−STD34’に供給され得ることを示す。
【0037】
また、
図5には、エラーのない媒体を通じて、プログラムストリーム復号機能部90に供給されている3つのビデオPESを示す。基本層PESが基本層AVC−P−STD(バッファおよびデコーダを含む)に対し供給されるのに対し、基本層PESおよび2つの拡張層PES(ENH1,ENH2)は、プログラムストリーム・マルチプレクサに対し供給される。プログラムストリーム・マルチプレクサは、SVC−P−STDモデルに準拠するバッファを備える。プログラムストリーム・マルチプレクサは、基本層PESおよび拡張層PES(ENH1)をSVCデコーダ91に供給する。これは、基本層PESおよび拡張層PESからPESヘッダを除去し、エレメンタリストリーム・バッファセグメントESb0に基本層ビットストリームを宛て、エレメンタリストリーム・バッファセグメントESb1に拡張層ENH1ビットストリームを宛てる、プログラムストリーム・デマルチプレクサを含む。バッファセグメントESb0,ESb1の出力は、再アセンブリ機能部に渡される。バッファセグメントESb0,ESb1のサイズは、バッファ80,81におけるエレメンタリストリーム・バッファセグメントのサイズと同様に変化し得る。SVCデコーダ91の動作は、したがって、プログラムストリームに関してはバッファ80,81の動作に相当し、トランスポートストリームに関しては再アセンブリ機能部に相当する。
【0038】
プログラムストリーム・マルチプレクサは、基本層PESと2つの拡張層PES(ENH1,ENH2)とをSVCデコーダ92に供給する。SVCデコーダ92はデコーダ91と同様であるが、T−STDバッファ82におけるエレメンタリストリーム・バッファに対応するエレメンタリストリーム・バッファセグメントESb2だけ増大している。プログラムストリーム復号機能部90は、したがって、基本層のみを、または基本層および拡張層ENH1を、または基本層ならびに拡張層ENH1および拡張層ENH2の両方を、復号することが可能である。
【0039】
図4に示した実施形態および
図5に示した実施形態の両方において、利用可能なバッファサイズは、補遺Gを含むH.264/AVC標準規格における制限に基づき、エンコーダによって生成されるビットストリームの様々な層に対し、必要に応じて動的に割り当てられてよい。このようにして様々な層に対するバッファサイズの動的で柔軟な割当を可能とすることによって、デコーダは、例えば、アクセスユニットの複雑さに基づき、基本層に対するバッファサイズの割当を減少させるとともに、拡張層のうちの1つ以上に対するバッファサイズの割当を増加させて、適切な復号を行うことができる。
【0040】
SVC区切NALユニットは、トランスポートストリーム・デマルチプレクサ76によって容易に検出され、SVC−VCL−NALユニットの分離を容易にする。SVC区切NALユニットは、デコーダによって認識されず、したがって、拡張層アクセスユニットの復号に影響を与えない。
【0041】
図4に関連して記載したように、NAL分離器は、基本層PESが
図2に示すアクセスユニット構造のAVC−NALユニットのみを含み、拡張層PESがSVC−NALユニットを全て含むように、SVC−非VCL−NALユニットおよびSVC−VCL−NALユニットの両方をSVCアクセスユニットから分離することができる。一方、
図5の場合には、NAL分離器は、基本層PESがSVC−非VCL−NALユニットを含むように、AVC−NALユニットによってSVC−非VCL−NALユニットをグループ化する。この手法によって、基本層PESを送信するのに必要な帯域幅はわずかに増大するが、
図2に示すSVCアクセスユニット構造に対する考察から、基本層PESにSVC−非VCL−NALユニットを含めることで、基本層PESおよび拡張層PESにそれぞれ含まれるNALユニットの単純な連結によってSVCアクセスユニットの再アセンブリを行うことが可能であることが認められる。他の場合には、再アセンブリバッファではデータ
の構文解析(パース)が必要となり、処理にレイテンシおよび複雑さが加わる。SVCアクセスユニットの再アセンブリが単純であるため、基本層PESを送信するのにわずかに大きな帯域幅が必要であるという小さな不利は相殺される。
【0042】
図6を参照すると、
図4または
図5に示したNAL分離器およびパケット化器、
図4に示したトランスポートストリーム・デマルチプレクサ56およびビデオT−STD60、または
図5に示したプログラムストリームまたはトランスポートストリームの復号機能部は、一般に従来のアーキテクチャにより構成された、1つ以上のプロセッサ161、ランダムアクセスメモリ162、リードオンリメモリ163、I/Oデバイス164(ビットストリームの送受信のための適切なアダプタを含む)、ユーザ・インタフェース165、CD−ROMドライブ166、およびハードディスクドライブ167を備える、コンピュータを用いて実装できる。このコンピュータは、ハードディスクドライブ167またはCD−ROM168などコンピュータ可読媒体に記憶され、実行のためにランダムアクセスメモリ162へロードされるプログラムによって、動作する。このプログラムは、コンピュータが、入力アダプタを介して含まれる特定の入力信号を運ぶビットストリームを受信するとき、コンピュータが適切なバッファにメモリを割り当てるとともに他の適切な資源を利用し、
図4および5に関連して記載した様々な動作を実行するように機能して、特定の出力信号を運ぶビットストリームを出力アダプタを介して送信する命令から構成されている。
【0043】
1つまたは2つの拡張層に関連してスケーラブルなビデオストリームについて記載したが、H.264/AVCに対する補遺Gでは7つまでの拡張層が可能であることが、当業者には認められる。また、スケーラブルなビデオに関して拡張層について記載したが、AVC基本層に対する他の種類の拡張も可能であることも認められる。
【0044】
添付の特許請求の範囲では、H.264/AVCに関する参照文献において用いられる用語(シンタックス構造など)も用いているが、それは読手の簡便のためのものであり、H.264/AVCに記載されている特定のビデオ符号化に依存した方法、装置、およびコンピュータ可読媒体に、特許請求の範囲を限定することを意図したものではない。