IP Force 特許公報掲載プロジェクト 2022.1.31 β版

知財求人 - 知財ポータルサイト「IP Force」

▶ ソニー株式会社の特許一覧

<>
  • 特許-受信装置 図1
  • 特許-受信装置 図2
  • 特許-受信装置 図3
  • 特許-受信装置 図4
  • 特許-受信装置 図5
  • 特許-受信装置 図6
  • 特許-受信装置 図7
  • 特許-受信装置 図8
  • 特許-受信装置 図9
  • 特許-受信装置 図10
  • 特許-受信装置 図11
  • 特許-受信装置 図12
  • 特許-受信装置 図13
  • 特許-受信装置 図14
  • 特許-受信装置 図15
  • 特許-受信装置 図16
  • 特許-受信装置 図17
  • 特許-受信装置 図18
  • 特許-受信装置 図19
  • 特許-受信装置 図20
  • 特許-受信装置 図21
  • 特許-受信装置 図22
< >
(19)【発行国】日本国特許庁(JP)
(12)【公報種別】特許公報(B2)
(11)【特許番号】
(24)【登録日】2023-10-30
(45)【発行日】2023-11-08
(54)【発明の名称】受信装置
(51)【国際特許分類】
   H04N 21/2362 20110101AFI20231031BHJP
   H04N 21/2389 20110101ALI20231031BHJP
   H04N 21/434 20110101ALI20231031BHJP
   H04N 19/30 20140101ALI20231031BHJP
   H04N 19/70 20140101ALI20231031BHJP
   H04H 20/28 20080101ALI20231031BHJP
   H04H 20/95 20080101ALI20231031BHJP
   H04H 40/18 20080101ALI20231031BHJP
【FI】
H04N21/2362
H04N21/2389
H04N21/434
H04N19/30
H04N19/70
H04H20/28
H04H20/95
H04H40/18
【請求項の数】 3
(21)【出願番号】P 2022100026
(22)【出願日】2022-06-22
(62)【分割の表示】P 2021084808の分割
【原出願日】2016-02-10
(65)【公開番号】P2022125084
(43)【公開日】2022-08-26
【審査請求日】2022-07-20
(31)【優先権主張番号】P 2015039234
(32)【優先日】2015-02-27
(33)【優先権主張国・地域又は機関】JP
(73)【特許権者】
【識別番号】000002185
【氏名又は名称】ソニーグループ株式会社
(74)【代理人】
【識別番号】100093241
【弁理士】
【氏名又は名称】宮田 正昭
(74)【代理人】
【識別番号】100101801
【弁理士】
【氏名又は名称】山田 英治
(74)【代理人】
【識別番号】100095496
【弁理士】
【氏名又は名称】佐々木 榮二
(74)【代理人】
【識別番号】100086531
【弁理士】
【氏名又は名称】澤田 俊夫
(74)【代理人】
【識別番号】110000763
【氏名又は名称】弁理士法人大同特許事務所
(72)【発明者】
【氏名】塚越 郁夫
【審査官】鈴木 隆夫
(56)【参考文献】
【文献】特開2015-080203(JP,A)
【文献】国際公開第2014/050447(WO,A1)
【文献】特開2015-005976(JP,A)
【文献】特開2015-005977(JP,A)
【文献】特開2007-257641(JP,A)
【文献】特開2012-054800(JP,A)
【文献】国際公開第2015/008775(WO,A1)
【文献】特表2013-511201(JP,A)
【文献】特表2015-501090(JP,A)
【文献】特表2015-503281(JP,A)
(58)【調査した分野】(Int.Cl.,DB名)
H04N 21/00-21/858
H04N 7/14-7/173
H04N 19/00-19/98
H04H 20/00-20/46
H04H 20/51-20/86
H04H 20/91-40/27
H04H 40/90-60/98
(57)【特許請求の範囲】
【請求項1】
基本フォーマット画像データの符号化画像データを持つ基本ビデオストリームとハイフレームレート画像データの符号化画像データを持つ拡張ビデオストリームの2つのビデオストリームを含む所定フォーマットのコンテナを受信する受信部を備え、
上記基本ビデオストリームに含まれる各ピクチャの符号化画像データに付加されるデコードタイムスタンプが示す時刻の間隔は均等とされており、
上記拡張ビデオストリームに含まれる各ピクチャの符号化画像データに付加されるデコードタイムスタンプが示す時刻の間隔は均等とされており、
上記拡張ビデオストリームに含まれる各ピクチャの符号化画像データに付加されるデコードタイムスタンプが示す時刻は、上記基本ビデオストリームに含まれる各ピクチャの符号化画像データに付加されるデコードタイムスタンプが示す時刻の中間とされており、
上記コンテナに含まれるビデオストリームに含まれる各ピクチャの符号化画像データに付加されるデコードタイムスタンプに基づいてデコード処理を行うデコード部と、
表示能力情報に基づいて、基本フォーマット画像データまたはハイフレームレート画像データを表示用画像データとして得る処理部をさらに備える
受信装置。
【請求項2】
LCD(Liquid Crystal Display)または有機EL(Organic Electro-Luminescence)パネルで構成され、上記表示用画像データを表示する表示部をさらに備える
請求項1に記載の受信装置。
【請求項3】
上記表示用画像データを表示する表示部とHDMI(High-Definition Multimedia Interface)で接続されるよう構成され、
上記表示部から、表示能力情報としてEDID(Extended display identification data)を取得する
請求項1に記載の受信装置
【発明の詳細な説明】
【技術分野】
【0001】
本技術は、受信装置に関する。
【背景技術】
【0002】
従来、基本フォーマット画像データと共に高品質フォーマット画像データを送信し、受信側において、基本フォーマット画像データまたは高品質フォーマット画像データを選択的に用いることが知られている。例えば、特許文献1には、メディア符号化をスケーラブルに行って、低解像度のビデオサービスのためのベースレイヤのストリームと、高解像度のビデオサービスのための拡張レイヤのストリームを生成し、これらを含む放送信号を送信することが記載されている。
【先行技術文献】
【特許文献】
【0003】
【文献】特表2008-543142号公報
【発明の概要】
【発明が解決しようとする課題】
【0004】
本技術の目的は、受信側において拡張ビデオストリームが持つ符号化画像データが対応する高品質フォーマットを容易に認識可能とすることにある。
【課題を解決するための手段】
【0005】
本技術の概念は、
基本フォーマット画像データの符号化画像データを持つ基本ビデオストリームと、複数種類の中から選択された一つの種類の高品質フォーマットの画像データの符号化画像データを持つ拡張ビデオストリームの2つのビデオストリームを生成する画像符号化部と、
上記基本ビデオストリームおよび上記拡張ビデオストリームを含む所定フォーマットのコンテナを送信する送信部と、
上記拡張ビデオストリームおよび/またはコンテナに、上記拡張ビデオストリームが持つ符号化画像データが対応する高品質フォーマットを表す情報を挿入する情報挿入部を備える
送信装置にある。
【0006】
本技術において、画像符号化部により、基本フォーマット画像データの符号化画像データを持つ基本ビデオストリームと、複数種類の中から選択された一つの種類の高品質フォーマット画像データの符号化画像データを持つ拡張ビデオストリームの2つのビデオストリームが生成される。そして、送信部により、基本ビデオストリームおよび拡張ビデオストリームを含む所定フォーマットのコンテナが送信される。
【0007】
例えば、画像符号化部は、基本フォーマット画像データに関しては、この基本フォーマット画像データ内の予測符号化処理を行って符号化画像データを得、高品質フォーマット画像データに関しては、この高品質フォーマット画像データ内の予測符号化処理または基本フォーマット画像データとの間の予測符号化処理を選択的に行って符号化画像データを得る、ようにされてもよい。
【0008】
この場合、例えば、基本フォーマット画像データは、通常ダイナミックレンジおよびローフレームレートの画像データであり、高品質フォーマット画像データは、ハイダイナミックレンジおよびハイフレームレートの画像データ、ハイダイナミックレンジおよびローフレームレートの画像データ、または通常ダイナミックレンジおよびハイフレームレートの画像データのいずれかであり、高品質フォーマット画像データの符号化画像データは、通常ダイナミックレンジ画像データに対する差分情報によるハイダイナミックレンジ画像データの符号化成分および/またはローフレームレート画像データに対する差分情報によるハイフレームレート画像データの符号化成分を持つ、ようにされてもよい。
【0009】
例えば、画像符号化部は、通常ダイナミックレンジ画像データに対する差分情報を求めるとき、差分値を小さくするために通常ダイナミックレンジ画像データにダイナミックレンジ変換を行う、ようにされてもよい。この場合、例えば、画像符号化部は、通常ダイナミックレンジ画像データに、通常ダイナミックレンジ光電変換特性による変換データの値をハイダイナミックレンジ光電変換特性による変換データの値に変換するための変換情報に基づいて、ダイナミックレンジ変換を行う、ようにされてもよい。
【0010】
情報挿入部により、拡張ビデオストリームおよび/またはコンテナに、拡張ビデオストリームの符号化画像データが対応する高品質フォーマットを表す情報(高品質フォーマット情報)が挿入される。例えば、拡張ビデオストリームはNALユニット構造を有し、情報挿入部は、高品質フォーマット情報を、NALユニットのヘッダに挿入する、ようにされてもよい。
【0011】
また、例えば、拡張ビデオストリームはNALユニット構造を有し、情報挿入部は、高品質フォーマット情報を、SEI NALユニットの領域に挿入する、ようにされてもよい。また、例えば、コンテナはMPEG2-TSであり、情報挿入部は、高品質フォーマット情報を、プログラムマップテーブルの配下に存在する拡張ビデオストリームに対応したビデオエレメンタリストリームループ内に挿入する、ようにされてもよい。
【0012】
例えば、情報挿入部は、拡張ビデオストリームおよび/またはコンテナに、上記の変換情報をさらに挿入する、ようにされてもよい。この場合、受信側においては、この変換情報に基づいて、ハイダイナミックレンジ画像データを得るために通常ダイナミックレンジ画像データに行うべきダイナミックレンジ変換の処理を適切に行うことが可能となる。
【0013】
このように本技術においては、拡張ビデオストリームの符号化画像データが対応する高品質フォーマットを表す情報(高品質フォーマット情報)が拡張ビデオストリームおよび/またはコンテナに挿入されるものである。そのため、受信側では、高品質フォーマット画像データの高品質フォーマットを容易に認識可能となる。そして、受信側では、この情報および表示能力情報に基づいて、基本ビデオストリームおよび拡張ビデオストリームから、表示能力に対応した画像データを表示用画像データとして得ることが可能となる。
【0014】
なお、本技術において、例えば、画像符号化部は、拡張ビデオストリームに含まれる各ピクチャの符号化画像データに付加されるデコードタイムスタンプが示す時刻を、基本ビデオストリームに含まれる各ピクチャの符号化画像データに付加されるデコードタイムスタンプが示す時刻と同じか中間とし、基本ビデオストリームに含まれる各ピクチャの符号化画像データに付加されるデコードタイムスタンプが示す時刻の間隔を均等とし、拡張ビデオストリームに含まれる各ピクチャの符号化画像データに付加されるデコードタイムスタンプが示す時刻の間隔を均等とする、ようにされてもよい。このようにデコードタイムスタンプの間隔が均等とされることで、受信側におけるデコード能力を効率よく使用可能となる。
【0015】
また、本技術の他の概念は、
基本フォーマット画像データの符号化画像データを持つ基本ビデオストリームと、複数種類の中から選択された一つの種類の高品質フォーマットの画像データの符号化画像データを持つ拡張ビデオストリームの2つのビデオストリームを含む所定フォーマットのコンテナを受信する受信部を備え、
上記拡張ビデオストリームおよび/またはコンテナに、上記拡張ビデオストリームが持つ符号化画像データが対応する高品質フォーマットを表す情報が挿入されており、
上記拡張ビデオストリームおよび/またはコンテナから上記情報を抽出する情報抽出部と、
上記抽出された情報および表示能力情報に基づいて、上記基本ビデオストリームおよび上記拡張ビデオストリームから表示能力に対応した画像データを表示用画像データとして得る処理部をさらに備える
受信装置にある。
【0016】
本技術において、受信部により、基本フォーマット画像データの符号化画像データを持つ基本ビデオストリームと、複数種類の中から選択された一つの種類の高品質フォーマットの画像データの符号化画像データを持つ拡張ビデオストリームの2つのビデオストリームを含む所定フォーマットのコンテナが受信される。例えば、基本ビデオストリームに含まれる符号化画像データは、基本フォーマット画像データに対して、この基本フォーマット画像データ内の予測符号化処理が行われて生成されており、拡張ビデオストリームに含まれる符号化画像データは、高品質フォーマット画像データに対して、この高品質フォーマット画像データ内の予測符号化処理または基本フォーマット画像データとの間の予測符号化処理が選択的に行われて生成されている、ようにされてもよい。
【0017】
拡張ビデオストリームおよび/またはコンテナに、拡張ビデオストリームが持つ符号化画像データが対応する高品質フォーマットを表す情報が挿入されている。情報抽出部により、拡張ビデオストリームおよび/またはコンテナから、この情報が抽出される。処理部により、抽出された情報および表示能力情報に基づいて、基本ビデオストリームおよび拡張ビデオストリームから表示能力に対応した画像データが表示用画像データとして得られる。
【0018】
このように本技術においては、拡張ビデオストリームが持つ符号化画像データが対応する高品質フォーマットを表す情報および表示能力情報に基づいて、基本ビデオストリームおよび拡張ビデオストリームから、表示能力に対応した画像データが表示用画像データとして得られるものである。そのため、表示能力に対応した画像データを表示用画像データとして効率よく得ることが可能となる。
【発明の効果】
【0019】
本技術によれば、受信側において拡張ビデオストリームが持つ符号化画像データが対応する高品質フォーマットを容易に認識可能となる。なお、ここに記載された効果は必ずしも限定されるものではなく、本開示中に記載されたいずれかの効果であってもよい。
【図面の簡単な説明】
【0020】
図1】実施の形態としての送受信システムの構成例を示すブロック図である。
図2】送信装置の構成例を示すブロック図である。
図3】基本フォーマット画像データVbと、高品質フォーマット画像データVeを生成する画像データ生成部の構成例を示すブロック図である。
図4】エンコード部の主要部の構成例を示すブロック図である。
図5】ダイナミックレンジ拡張の場合におけるレベル調整(ダイナミックレンジ変換)を説明するための図である。
図6】NALユニットヘッダの構造例と、その構造例における主要なパラメータの内容を示す図である。
図7】符号化方式がHEVCである場合におけるGOPの先頭のアクセスユニットを示す図である。
図8】符号化方式がHEVCである場合におけるGOPの先頭以外のアクセスユニットを示す図である。
図9】スケーラブル・リンケージSEIメッセージの構造例を示す図である。
図10】スケーラブル・リンケージSEIメッセージの構造例における主要な情報の内容を示す図である。
図11】基本ビデオストリームBSの符号化画像データと拡張ビデオストリームESの符号化画像データの構成例(HDR+HFR)を示す図である。
図12】符号化画像データにおけるデコード・表示タイミング(デコード・表示のタイムスタンプ)の管理を説明するための図である。
図13】基本ビデオストリームBSの符号化画像データと拡張ビデオストリームESの符号化画像データの構成例(HDR+LFR)を示す図である。
図14】基本ビデオストリームBSの符号化画像データと拡張ビデオストリームESの符号化画像データの構成例(SDR+HFR)を示す図である。
図15】基本ビデオストリームBSの符号化画像データと拡張ビデオストリームESの符号化画像データの構成例(「SDR+HFR」→「HDR+HFR」)を示す図である。
図16】基本ビデオストリームBSの符号化画像データと拡張ビデオストリームESの符号化画像データの構成例(「SDR+HFR」→「HDR+LFR」)を示す図である。
図17】基本ビデオストリームBSの符号化画像データと拡張ビデオストリームESの符号化画像データの構成例(「HDR+HFR」→「HDR+LFR」)を示す図である。
図18】スケーラブル・リンケージ・デスクリプタの構造例およびその構造例における主要な情報の内容を示す図である。
図19】NALユニットのヘッダの「nuh_layer_id」の値を符号化成分によって固定とする場合およびNALユニットのヘッダの「nuh_layer_id」の値をフレキシブルに割り当てる場合における各フィールドの値の一例を示す図である。
図20】トランスポートストリームTSの構成例を示す図である。
図21】受信装置の構成例を示すブロック図である。
図22】デコード部の主要部の構成例を示すブロック図である。
【発明を実施するための形態】
【0021】
以下、発明を実施するための形態(以下、「実施の形態」とする)について説明する。なお、説明は以下の順序で行う。
1.実施の形態
2.変形例
【0022】
<1.実施の形態>
[送受信システム]
図1は、実施の形態としての送受信システム10の構成例を示している。この送受信システム10は、送信装置100と、受信装置200とを有している。送信装置100は、コンテナとしてのトランスポートストリームTSを放送波あるいはネットのパケットに載せて送信する。
【0023】
このトランスポートストリームTSには、基本ビデオストリームと拡張ビデオストリームの2本のビデオストリームが含まれる。基本ビデオストリームは、基本フォーマット画像データの符号化画像データを持つものである。この基本フォーマット画像データは、通常ダイナミックレンジおよびローフレームレートの画像データである。この基本フォーマット画像データの符号化画像データは、基本フォーマット画像データに、例えば、H.264/AVC、H.265/HEVCなどの予測符号化処理が施されて生成されたものである。この場合、基本フォーマット画像データ内の予測符号化処理が行われて符号化画像データが得られる。
【0024】
拡張ビデオストリームは、複数種類の中から選択された一つの種類の高品質フォーマット画像データの符号化画像データを持つものである。この実施の形態において、高品質フォーマット画像データは、ハイダイナミックレンジおよびハイフレームレートの画像データ、ハイダイナミックレンジおよびローフレームレートの画像データ、または通常ダイナミックレンジおよびハイフレームレートの画像データのいずれかである。
【0025】
この拡張ビデオストリームの符号化画像データは、高品質フォーマット画像データに、例えば、H.264/AVC、H.265/HEVCなどの予測符号化処理が施されて生成されたものである。この場合、高品質フォーマット画像データ内の予測符号化処理または基本フォーマット画像データとの間の予測符号化処理が選択的に行われて符号化画像データが得られる。
【0026】
この場合、高品質フォーマット画像データの符号化画像データは、通常ダイナミックレンジ画像データに対する差分情報によるハイダイナミックレンジ画像データの符号化成分および/またはローフレームレート画像データに対する差分情報によるハイフレームレート画像データの符号化成分を持つものとなる。
【0027】
送信装置100は、拡張ビデオストリームおよび/またはコンテナとしてのトランスポートストリームTSに、拡張ビデオストリームの符号化画像データが対応する高品質フォーマットを表す情報(以下、適宜、「高品質フォーマット情報」という)を挿入する。この情報は、NALユニットのヘッダやSEI NALユニットの領域に挿入される。また、この情報は、プログラムマップテーブルの配下に存在する拡張ビデオストリームに対応したビデオエレメンタリストリームループ内に挿入される。
【0028】
受信装置200は、送信装置100から放送波あるいはネットのパケットに載せて送られてくるトランスポートストリームTSを受信する。このトランスポートストリームTSは、上述したように、基本フォーマット画像データの符号化画像データを持つ基本ビデオストリームと、高品質フォーマット画像データの符号化画像データを持つ拡張ビデオストリームを有している。
【0029】
拡張ビデオストリームおよび/またはコンテナとしてのトランスポートストリームTSに、上述したように、高品質フォーマット情報が挿入されている。受信装置200は、この情報と表示能力情報に基づいて、基本ビデオストリームおよび拡張ビデオストリームから表示能力に対応した画像データを表示用画像データとして取得する。
【0030】
「送信装置の構成」
図2は、送信装置100の構成例を示している。この送信装置100は、送信画像データとして、基本フォーマット画像データVbと、高品質フォーマット画像データVeを取り扱う。ここで、基本フォーマット画像データVbは、フレーム周波数が50Hz(LFR:ローフレームレート)であるSDR(Standard Dynamic Range)画像データである。
【0031】
高品質フォーマット画像データVeは、例えば、(a)フレーム周波数が100Hz(HFR:ハイフレームレート)であるHDR画像データ、(b)フレーム周波数が50Hz(LFR)であるHDR画像データ、あるいは(c)フレーム周波数が100Hz(HFR)であるSDR画像データの3つの種類の中から選択された一つの種類の高品質フォーマット画像データとされる。HDR画像データは、従来のLDR画像の白ピークの明るさを100%とすると、0~100%*N、例えば0~1000%あるいはそれ以上の範囲の輝度を持つ。
【0032】
図3は、基本フォーマット画像データVbと、高品質フォーマット画像データVeを生成する画像データ生成部150の構成例を示している。この画像データ生成部150は、カメラ151と、変換部152を有している。
【0033】
カメラ151は、被写体を撮像して、高品質フォーマット画像データVeを出力する。カメラ151が出力する高品質フォーマット画像データVeが、フレーム周波数が100HzのHDR画像データである場合、変換部152は、フレームレートおよびダイナミックレンジの変換を行って、フレーム周波数が50HzのSDR画像データである基本フォーマット画像データVbを出力する。
【0034】
また、カメラ151が出力する高品質フォーマット画像データVeが、フレーム周波数が50HzのHDR画像データである場合、変換部152は、ダイナミックレンジの変換のみを行って、フレーム周波数が50HzのSDR画像データである基本フォーマット画像データVbを出力する。また、カメラ151が出力する高品質フォーマット画像データVeが、フレーム周波数が100HzのSDR画像データである場合、変換部152は、フレームレートの変換のみを行って、フレーム周波数が50HzのSDR画像データである基本フォーマット画像データVbを出力する。
【0035】
図2に戻って、送信装置100は、制御部101と、光電変換部102と、RGB/YCbCr変換部103と、光電変換部104と、RGB/YCbCr変換部105と、ビデオエンコーダ106と、システムエンコーダ107と、送信部108を有している。制御部101は、CPU(Central Processing Unit)を備えて構成され、制御プログラムに基づいて、送信装置100の各部の動作を制御する。
【0036】
光電変換部102は、基本フォーマット画像データVbに対して、SDR光電変換特性(SDR OETFカーブ)を適用して、伝送用の基本フォーマット画像データVb´を得る。RGB/YCbCr変換部103は、この基本フォーマット画像データVb´を、RGBドメインからYCbCr(輝度・色差)ドメインに変換する。
【0037】
光電変換部104は、高品質フォーマット画像データVeに対して、HDR光電変換特性(HDR OETFカーブ)あるいはSDR光電変換特性(SDR OETFカーブ)を適用して、伝送用の高品質フォーマット画像データVe´を得る。RGB/YCbCr変換部105は、この高品質フォーマット画像データVe´を、RGBドメインからYCbCr(輝度・色差)ドメインに変換する。
【0038】
ビデオエンコーダ106は、エンコード部106bおよびエンコード部106eを有する。エンコード部106bは、伝送用の基本フォーマット画像データVb´に対してH.264/AVC、H.265/HEVCなどの予測符号化処理を施して符号化画像データを得、この符号化画像データを持つ基本ビデオストリーム(ビデオエレメンタリストリーム)BSを生成する。
【0039】
エンコード部106eは、伝送用の高品質フォーマット画像データVe´に対してH.264/AVC、H.265/HEVCなどの予測符号化処理を施して符号化画像データを得、この符号化画像データを持つ拡張ビデオストリーム(ビデオエレメンタリストリーム)ESを生成する。この場合、エンコード部106eは、予測残差を小さくするために、符号化ブロック毎に、画像データVe´内の予測、または画像データVb´との間の予測を、選択的に行う。
【0040】
図4は、エンコード部106eの主要部の構成例を示している。エンコード部106eは、レイヤ内予測部161と、レイヤ間予測部162と、予測調整部163と、選択部164と、エンコード機能部165を有している。
【0041】
レイヤ内予測部161は、符号化対象の画像データV1に対して、この画像データV1内での予測(レイヤ内予測)を行って予測残差データを得る。レイヤ間予測部162は、符号化対象の画像データV1に対して、参照対象の画像データV2との間での予測(レイヤ間予測)を行って予測残差データを得る。
【0042】
予測調整部163は、レイヤ間予測部162におけるレイヤ間予測を効率よく行うために、画像データV1の、画像データV2に対するスケーラブル拡張のタイプに応じて、以下の処理を行う。すなわち、ダイナミックレンジ拡張の場合は、SDRからHDRに変換するためのレベル調整(ダイナミックレンジ変換)を行う。フレームレート拡張の場合は、バイパスする。
【0043】
図5を参照して、ダイナミックレンジ拡張の場合におけるレベル調整(ダイナミックレンジ変換)についてさらに説明する。実線aは、SDR光電変換特性を示すSDR OETFカーブの一例を示している。実線bは、HDR光電変換特性を示すHDR OETFカーブの一例を示している。横軸は入力輝度レベルを示し、P1はSDR最大レベルに対応する入力輝度レベルを示し、P2はHDR最大レベルに対応する入力輝度レベルを示している。
【0044】
また、縦軸は伝送符号値または正規化された符号化レベルの相対値を示す。相対最大レベルMはHDR最大レベルおよびSDR最大レベルを示す。基準レベルGは、SDR最大レベルに対応する入力輝度レベルP1におけるHDR OETFの伝送レベルを示すもので、いわゆるリファレンスの白レベルを意味する。分岐レベルBは、SDR OETFカーブとHDR OETFカーブとが同一軌道から分岐して別れるレベルを示す。Pfは、分岐レベルに対応する入力輝度レベルを示す。なお、この分岐レベルBは、0以上の任意の値とすることができる。
【0045】
予測調整部163におけるレベル調整(ダイナミックレンジ変換)では、基本フォーマット画像データVb´のうち、分岐レベルBから相対最大レベルMまでが、HDR光電変換特性による変換データの値となるように変換される。この場合、SDRの相対最大レベルMは基準レベルGと一致するようにされる。なお、分岐レベルB未満の入力データは、そのまま出力データとされる。
【0046】
ここで、変換情報は、変換テーブルあるいは変換係数で与えられる。変換テーブルで与えられる場合、予測調整部163は、この変換テーブルを参照して変換を行う。一方、変換係数で与えられる場合、予測調整部163は、この変換係数を用いた演算により変換を行う。例えば、変換係数をCとするとき、分岐レベルBから相対最大レベルMまでの入力データに関して、以下の(1)式により、変換を行う。
出力データ=分岐レベルB+(入力データ-分岐レベルB)*C ・・・(1)
【0047】
選択部164は、符号化ブロック毎に、レイヤ内予測部161で得られる予測残差データ、またはレイヤ間予測部162で得られる予測残差データを選択的に取り出し、エンコード機能部165に送る。この場合、選択部164では、例えば、予測残差の小さい方が取り出される。エンコード機能部165は、選択部164から取り出された予測残差データに対して、変換符号化、量子化、エントロピー符号化などのエンコード処理を行って、符号化画像データCVを得る。
【0048】
拡張ビデオストリームに含まれる符号化画像データには、高品質フォーマット画像データVeに応じた種類の符号化成分が含まれる。すなわち、画像データVeが(a)HFR(100Hz)かつHDRの画像データであるときは、HDRでHFRの符号化成分が含まれる。また、画像データVeが(b)LFR(50Hz)かつHDRの画像データであるときは、HDRでLFRの符号化成分が含まれる。また、画像データVeが(c)HFR(100Hz)かつSDRの画像データであるときは、SDRでHFRの符号化成分が含まれる。
【0049】
図2に戻って、エンコード部106eは、拡張ビデオストリームESに、拡張ビデオストリームの符号化画像データが対応する高品質フォーマットを表す情報(高品質フォーマット情報)を挿入する。エンコード部106eは、この高品質フォーマット情報を、例えば、NALユニットのヘッダ、あるいはSEI NALユニットの領域に挿入する。
【0050】
図6(a)は、NALユニットヘッダの構造例(Syntax)を示し、図6(b)は、その構造例における主要なパラメータの内容(Semantics)を示している。「forbidden_zero_bit」の1ビットフィールドは、0が必須である。「nal_unit_type」の6ビットフィールドは、NALユニットタイプを示す。「nuh_layer_id」の6ビットフィールドは、拡張レイヤのIDを示す。「nuh_temporal_id_plus1」の3ビットフィールドは、temporal_id(0~6)を示し、1を加えた値(1~7)を取る。
【0051】
基本ビデオストリームにおいて、「nuh_layer_id」の値は“0”とされる。高品質フォーマット情報をNALユニットのヘッダに挿入するときには、当該拡張ビデオストリームにおいて、「nuh_layer_id」の値は、符号化画像データに含まれる符号化成分の種類によって固定とされる。つまり、符号化画像データが対応する高品質フォーマットの種類に応じた固定値とされる。
【0052】
このとき、「nuh_layer_id」は、高品質フォーマット情報を構成する。例えば、符号化画像データに含まれる符号化成分がHDRでHFRの符号化成分であるときには、「nuh_layer_id」は“6”とされる。また、符号化画像データに含まれる符号化成分がHDRでLFRの符号化成分であるときには、「nuh_layer_id」は“5”とされる。また、符号化画像データに含まれる符号化成分がSDRでHFRの符号化成分であるときには、「nuh_layer_id」は“0”とされる。
【0053】
一方、この拡張ビデオストリームにおいて、「nuh_layer_id」の値をフレキシブルに割り当てる場合には、高品質フォーマット情報をSEI NALユニットに挿入する。この場合は、「nuh_layer_id」は、拡張ビデオストリームの符号化画像データが対応する高品質フォーマットを直接的に指し示す機能は持たない。
【0054】
このとき、エンコード部106eは、アクセスユニット(AU)の“SEIs”の部分に、高品質フォーマット情報を持つ、新規定義するスケーラブル・リンケージSEIメッセージ(Scalable_linkage SEI message)を挿入する。
【0055】
図7は、符号化方式がHEVCである場合におけるGOP(Group Of Pictures)の先頭のアクセスユニットを示している。また、図8は、符号化方式がHEVCである場合におけるGOPの先頭以外のアクセスユニットを示している。HEVCの符号化方式の場合、画素データが符号化されているスライス(slices)の前にデコード用のSEIメッセージ群「Prefix_SEIs」が配置され、このスライス(slices)の後に表示用のSEIメッセージ群「Suffix_SEIs」が配置される。スケーラブル・リンケージSEIメッセージは、図示のように、例えば、SEIメッセージ群「Suffix_SEIs」としてあるいは「Prefix SEIs」として配置される。
【0056】
図9は、スケーラブル・リンケージSEIメッセージの構造例(Syntax)を示している。図10は、その構造例における主要な情報の内容(Semantics)を示している。「Scalable_linkage_cancel_flag」の1ビットのフラグ情報は、“Scalable_linkage”のSEIメッセージをリフレッシュするかを示す。“0”は、このSEIメッセージをリフレッシュすることを示す。“1”は、このSEIメッセージをリフレッシュしないこと、つまり前のメッセージをそのまま維持することを示す。
【0057】
「Scalable_linkage_cancel_flag」が“0”であるとき、以下のフィールドが存在する。「scalable_index」の16ビットフィールドは、スケーラブル拡張ストリームの種類を示すインデックスである。つまり、このフィールドは、高品質フォーマット情報を構成する。
【0058】
例えば、“0x8”は、HDRへの拡張成分、つまり符号化画像データに含まれる符号化成分がHDRでLFRの符号化成分であることを示す。また、“0x10”は、HFRへの拡張成分、つまり符号化画像データに含まれる符号化成分がSDRでHFRの符号化成分であることを示す。また、“0x18”は、HDRおよびHFRへの拡張成分、つまり符号化画像データに含まれる符号化成分がHDRでHFRの符号化成分であることを示す。
【0059】
「nuh_layer_id」の6ビットフィールドは、拡張ビデオストリームに含まれるレイヤID(layer ID)を示す。「reference_level」の15ビットフィールドは、基準輝度レベル値、つまり基準レベルG(図5参照)を示す。「conversion_table_flag」の1ビットのフラグ情報は、変換テーブルによること、つまり変換テーブル情報が存在することを示す。
【0060】
「conversion_table_flag」が“1”であるとき、「table_size」の8ビットフィールドが存在する。このフィールドは、変換テーブルの入力数を示す。そして、その入力数だけ、「predctrl_y[i]」、「predctrl_cb[i]」、「predctrl_cr[i]」の各16ビットフィールドが存在する。「predctrl_y[i]」のフィールドは、輝度に関す予測調整変換の値を示す。「predctrl_cb[i]」のフィールドは、色差Cbに関す予測調整変換の値を示す。「predctrl_cr[i]」のフィールドは、色差Crに関す予測調整変換の値を示す。
【0061】
図11は、エンコード部106bで得られる基本ビデオストリームBSの符号化画像データと、エンコード部106eで得られる拡張ビデオストリームESの符号化画像データの構成例を示している。この例は、基本ビデオストリームBSの符号化画像データにSDRでLFRの符号化成分が含まれ、拡張ビデオストリームESの符号化画像データにHDRでHFRの符号化成分が含まれる例である。この例は、「nuh_layer_id」の値が符号化画像データに含まれる符号化成分の種類によって固定とされ、この「nuh_layer_id」が高品質フォーマット情報を構成する例である。
【0062】
横軸は表示順(POC:picture order of composition)を示し、左側は表示時刻が前で、右側は表示時刻が後になる。縦軸は階層を示している。矩形枠のそれぞれがピクチャを示し、矢印は、予測符号化処理におけるピクチャの参照関係の一例を示している。レイヤ間、レイヤ内の双方とも予測はブロックごとに対象ピクチャが変わり、また、予測の向き、参照数は図示の例に限定されるわけではない。矩形枠内の数字は、符号化されるピクチャの順、つまりエンコード順(受信側ではデコード順)を示している。サブ・ピクチャグループ(Sub group of pictures)がいくつか集まってGOP(Group Of Pictures)となる。
【0063】
基本ビデオストリームの符号化画像データは、0,1の2階層で階層符号化されている。階層0,1のピクチャの符号化画像データを構成するNALユニット(nal_unit)のヘッダに配置されるtemporal_id(階層識別情報)として、それぞれ、0,1が設定される。また、各NALユニットのヘッダの「nuh_layer_id」の値は“0”とされる。
【0064】
また、拡張ビデオストリームの符号化画像データは、0,1,2の3階層で階層符号化されている。階層0,1,2のピクチャの符号化画像データを構成するNALユニット(nal_unit)のヘッダに配置されるtemporal_id(階層識別情報)として、それぞれ、0,1,2が設定される。また、各NALユニットのヘッダの「nuh_layer_id」の値は“6”とされ、符号化画像データに含まれる符号化成分がHDRでHFRの符号化成分であることが示される。
【0065】
図12は、図11の階層符号化の場合におけるデコード・表示タイミング(デコード・表示のタイムスタンプ)の管理を概略的に示している。各数字は、図11のピクチャを示す各矩形枠内の数字に対応している。
【0066】
「B」は、基本フレーム周波数を構成するピクチャを示している。「L」は、基本フレーム周波数で、ダイナミックレンジは基本ビデオストリームBSとの予測差分となるピクチャ成分を示している。「U」は、基本フレーム周波数のフレーム同士の中間のタイミングに位置するフレームで、「L」あるいは「B」のフレームと時間的に合成することでハイフレーム周波数となる。また、「U」には、ダイナミックレンジにおいても「B」あるいは「L」との差分成分を持つことができ、これらと合成することでハイダイナミックレンジとなる。
【0067】
デコードタイミング(デコードタイムスタンプ)の管理では、「B」、「L」のデコードは同時刻に、「U」のデコードは前後の「B」または「L」のデコード時刻のちょうど中間になるようにエンコードバッファ管理(HRD管理)が行われる。表示タイミング(表示タイムスタンプ)も同様に、「B」、「L」は同時刻に予測合成表示され、「U」の表示は前後の基本フレーム周波数画像の表示時刻のちょうど中間になるようにエンコードバッファ管理(HRD管理)がなされる。
【0068】
なお、詳細説明は省略するが、以下のその他の構成例においても、デコード・表示タイミング(デコード・表示のタイムスタンプ)の管理が同様に行われる。
【0069】
図13も、エンコード部106bで得られる基本ビデオストリームBSの符号化画像データと、エンコード部106eで得られる拡張ビデオストリームESの符号化画像データの構成例を示している。この例は、基本ビデオストリームBSの符号化画像データにSDRでLFRの符号化成分が含まれ、拡張ビデオストリームESの符号化画像データにHDRでLFRの符号化成分が含まれる例である。この例は、「nuh_layer_id」の値が符号化画像データに含まれる符号化成分の種類によって固定とされ、この「nuh_layer_id」が高品質フォーマット情報を構成する例である。
【0070】
基本ビデオストリームの符号化画像データは、0,1の2階層で階層符号化されている。階層0,1のピクチャの符号化画像データを構成するNALユニット(nal_unit)のヘッダに配置されるtemporal_id(階層識別情報)として、それぞれ、0,1が設定される。また、各NALユニットのヘッダの「nuh_layer_id」の値は“0”とされる。
【0071】
また、拡張ビデオストリームの符号化画像データは、切換え前のサブ・ピクチャグループでは0,1の2階層で階層符号化されており、階層0,1のピクチャの符号化画像データを構成するNALユニット(nal_unit)のヘッダに配置されるtemporal_id(階層識別情報)として、それぞれ、0,1が設定される。
【0072】
切り換え後のサブ・ピクチャグループでは0,2の2階層で階層符号化されており、階層0,2のピクチャの符号化画像データを構成するNALユニット(nal_unit)のヘッダに配置されるtemporal_id(階層識別情報)として、それぞれ、0,2が設定される。また、各NALユニットのヘッダの「nuh_layer_id」の値は“5”とされ、符号化画像データに含まれる符号化成分がHDRでLFRの符号化成分であることが示される。
【0073】
図14も、エンコード部106bで得られる基本ビデオストリームBSの符号化画像データと、エンコード部106eで得られる拡張ビデオストリームESの符号化画像データの構成例を示している。この例は、基本ビデオストリームBSの符号化画像データにSDRでLFRの符号化成分が含まれ、拡張ビデオストリームESの符号化画像データにSDRでHFRの符号化成分が含まれる例である。この例は、「nuh_layer_id」の値が符号化画像データに含まれる符号化成分の種類によって固定とされ、この「nuh_layer_id」が高品質フォーマット情報を構成する例である。
【0074】
基本ビデオストリームの符号化画像データは、0,1の2階層で階層符号化されている。階層0,1のピクチャの符号化画像データを構成するNALユニット(nal_unit)のヘッダに配置されるtemporal_id(階層識別情報)として、それぞれ、0,1が設定される。また、各NALユニットのヘッダの「nuh_layer_id」の値は“0”とされる。
【0075】
また、拡張ビデオストリームの符号化画像データは、切換え前のサブ・ピクチャグループでは0,1,2の3階層で階層符号化されており、階層0,1,2のピクチャの符号化画像データを構成するNALユニット(nal_unit)のヘッダに配置されるtemporal_id(階層識別情報)として、それぞれ、0,1,2が設定される。ここで、ピクチャ「2」、「5」、「8」、「11」はそれぞれピクチャ「1」、「4」、「7」、「10」のコピーであり、ピクチャ「3」はピクチャ「2」を、ピクチャ「6」はピクチャ「5」を参照する。
【0076】
切り換え後のサブ・ピクチャグループでは0の1階層で階層符号化されており、階層0のピクチャの符号化画像データを構成するNALユニット(nal_unit)のヘッダに配置されるtemporal_id(階層識別情報)として0が設定される。なお、破線で示すように、階層1の1階層あるいは階層2の1階層を用いることもできる。また、各NALユニットのヘッダの「nuh_layer_id」の値は“0”とされ、符号化画像データに含まれる符号化成分がSDRでHFRの符号化成分であることが示される。
【0077】
図15も、エンコード部106bで得られる基本ビデオストリームBSの符号化画像データと、エンコード部106eで得られる拡張ビデオストリームESの符号化画像データの構成例を示している。この例は、基本ビデオストリームBSの符号化画像データにSDRでLFRの符号化成分が含まれ、拡張ビデオストリームESの符号化画像データに、切換え前はSDRでHFRの符号化成分が含まれ、切換え後はHDRでHFRの符号化成分が含まれる例である。
【0078】
この例は、「nuh_layer_id」の値がフレキシブルに割り当てられ、この「nuh_layer_id」が高品質フォーマット情報を構成しない例である。つまり、スケーラブル・リンケージSEIメッセージの「scalable_index」が高品質フォーマット情報を構成する例である。
【0079】
基本ビデオストリームの符号化画像データは、0,1の2階層で階層符号化されている。階層0,1のピクチャの符号化画像データを構成するNALユニット(nal_unit)のヘッダに配置されるtemporal_id(階層識別情報)として、それぞれ、0,1が設定される。また、各NALユニットのヘッダの「nuh_layer_id」の値は“0”とされる。
【0080】
また、拡張ビデオストリームの符号化画像データは、切換え前のサブ・ピクチャグループでは0,1,2の3階層で階層符号化されており、階層0,1,2のピクチャの符号化画像データを構成するNALユニット(nal_unit)のヘッダに配置されるtemporal_id(階層識別情報)として、それぞれ、0,1,2が設定される。ここで、ピクチャ「2」、「5」、「8」、「11」はそれぞれピクチャ「1」、「4」、「7」、「10」のコピーであり、ピクチャ「3」はピクチャ「2」を、ピクチャ「6」はピクチャ「5」を参照する。
【0081】
切り換え後のサブ・ピクチャグループでは0,1,2の3階層で階層符号化されており、階層0,1,2のピクチャの符号化画像データを構成するNALユニット(nal_unit)のヘッダに配置されるtemporal_id(階層識別情報)として0,1,2が設定される。ここで、ピクチャ「14」、「17」、「20」、「23」はそれぞれピクチャ「13」、「16」、「19」、「22」のHDR差分のピクチャである。
【0082】
各NALユニットのヘッダの「nuh_layer_id」の値は切り換え前も切り換え後も“6”とされ、この「nuh_layer_id」では拡張ビデオストリームの符号化画像データに含まれる符号化成分の種類は示されない。この場合、切換え前に対応して「scalable_index」は“0x10”とされてSDRでHFRの符号化成分であることが示され、切換え後に対応して「scalable_index」は“0x18”とされてHDRでHFRの符号化成分であることが示される。
【0083】
図16も、エンコード部106bで得られる基本ビデオストリームBSの符号化画像データと、エンコード部106eで得られる拡張ビデオストリームESの符号化画像データの構成例を示している。この例は、基本ビデオストリームBSの符号化画像データにSDRでLFRの符号化成分が含まれ、拡張ビデオストリームESの符号化画像データに、切換え前はSDRでHFRの符号化成分が含まれ、切換え後はHDRでLFRの符号化成分が含まれる例である。
【0084】
この例は、「nuh_layer_id」の値がフレキシブルに割り当てられ、この「nuh_layer_id」が高品質フォーマット情報を構成しない例である。つまり、スケーラブル・リンケージSEIメッセージの「scalable_index」が高品質フォーマット情報を構成する例である。
【0085】
基本ビデオストリームの符号化画像データは、0,1の2階層で階層符号化されている。階層0,1のピクチャの符号化画像データを構成するNALユニット(nal_unit)のヘッダに配置されるtemporal_id(階層識別情報)として、それぞれ、0,1が設定される。また、各NALユニットのヘッダの「nuh_layer_id」の値は“0”とされる。
【0086】
また、拡張ビデオストリームの符号化画像データは、切換え前のサブ・ピクチャグループでは0,1,2の3階層で階層符号化されており、階層0,1,2のピクチャの符号化画像データを構成するNALユニット(nal_unit)のヘッダに配置されるtemporal_id(階層識別情報)として、それぞれ、0,1,2が設定される。ここで、ピクチャ「2」、「5」、「8」、「11」はそれぞれピクチャ「1」、「4」、「7」、「10」のコピーであり、ピクチャ「3」はピクチャ「2」を、ピクチャ「6」はピクチャ「5」を参照する。
【0087】
切り換え後のサブ・ピクチャグループでは0,1,2の3階層で階層符号化されており、階層0,1,2のピクチャの符号化画像データを構成するNALユニット(nal_unit)のヘッダに配置されるtemporal_id(階層識別情報)として0,1,2が設定される。ここで、ピクチャ「14」、「16」、「18」、「20」はそれぞれピクチャ「13」、「15」、「17」、「19」のHDR差分のピクチャである。
【0088】
各NALユニットのヘッダの「nuh_layer_id」の値は切り換え前も切り換え後も“6”とされ、この「nuh_layer_id」では拡張ビデオストリームの符号化画像データに含まれる符号化成分の種類は示されない。この場合、切換え前に対応して「scalable_index」は“0x10”とされてSDRでHFRの符号化成分であることが示され、切換え後に対応して「scalable_index」は“0x08”とされてHDRでLFRの符号化成分であることが示される。
【0089】
図17も、エンコード部106bで得られる基本ビデオストリームBSの符号化画像データと、エンコード部106eで得られる拡張ビデオストリームESの符号化画像データの構成例を示している。この例は、基本ビデオストリームBSの符号化画像データにSDRでLFRの符号化成分が含まれ、拡張ビデオストリームESの符号化画像データに、切換え前はHDRでHFRの符号化成分が含まれ、切換え後はHDRでLFRの符号化成分が含まれる例である。
【0090】
この例は、「nuh_layer_id」の値がフレキシブルに割り当てられ、この「nuh_layer_id」が高品質フォーマット情報を構成しない例である。つまり、スケーラブル・リンケージSEIメッセージの「scalable_index」が高品質フォーマット情報を構成する例である。
【0091】
基本ビデオストリームの符号化画像データは、0,1の2階層で階層符号化されている。階層0,1のピクチャの符号化画像データを構成するNALユニット(nal_unit)のヘッダに配置されるtemporal_id(階層識別情報)として、それぞれ、0,1が設定される。また、各NALユニットのヘッダの「nuh_layer_id」の値は“0”とされる。
【0092】
また、拡張ビデオストリームの符号化画像データは、切換え前のサブ・ピクチャグループでは0,1,2の3階層で階層符号化されており、階層0,1,2のピクチャの符号化画像データを構成するNALユニット(nal_unit)のヘッダに配置されるtemporal_id(階層識別情報)として、それぞれ、0,1,2が設定される。ここで、ピクチャ「2」、「5」、「8」、「11」はそれぞれピクチャ「1」、「4」、「7」、「10」のHDR差分のピクチャである。
【0093】
切り換え後のサブ・ピクチャグループでは0,1,2の3階層で階層符号化されており、階層0,1,2のピクチャの符号化画像データを構成するNALユニット(nal_unit)のヘッダに配置されるtemporal_id(階層識別情報)として0,1,2が設定される。ここで、ピクチャ「14」、「16」、「18」、「20」はそれぞれピクチャ「13」、「15」、「17」、「19」のHDR差分のピクチャである。
【0094】
各NALユニットのヘッダの「nuh_layer_id」の値は切り換え前も切り換え後も“6”とされ、この「nuh_layer_id」では拡張ビデオストリームの符号化画像データに含まれる符号化成分の種類は示されない。この場合、切換え前に対応して「scalable_index」は“0x18”とされてHDRでHFRの符号化成分であることが示され、切換え後に対応して「scalable_index」は“0x08”とされてHDRでLFRの符号化成分であることが示される。
【0095】
図2に戻って、システムエンコーダ107は、ビデオエンコーダ106で生成された基本ビデオストリームBSおよび拡張ビデオストリームESに対してPESパケット化およびTSパケット化を行って、トランスポートストリームTSを生成する。そして、送信部108は、このトランスポートストリームTSを、放送波あるいはネットのパケットに載せて、受信装置200に送信する。
【0096】
システムエンコーダ107は、コンテナとしてのトランスポートストリームTSに、高品質フォーマット情報を挿入する。この実施の形態において、PMT(Program Map Table)の配下に存在する拡張ビデオストリームに対応したビデオエレメンタリストリームループ中に、新規定義するスケーラブル・リンケージ・デスクリプタ(Scalable_linkage descriptor)を挿入する。
【0097】
図18(a)は、スケーラブル・リンケージ・デスクリプタの構造例(Syntax)を示している。図18(b)は、その構造例における主要な情報の内容(Semantics)を示している。「descriptor_tag」の8ビットフィールドは、デスクリプタタイプを示し、ここでは、スケーラブル・リンケージ・デスクリプタであることを示す。「descriptor_length」の8ビットフィールドは、デスクリプタの長さ(サイズ)を示し、デスクリプタの長さとして以降のバイト数を示す。
【0098】
「scalable_index」の16ビットフィールドは、スケーラブル拡張ストリームの種類を示すインデックスである。この「scalable_index」のフィールドは、上述したスケーラブル・リンケージSEIメッセージ(図9参照)の「scalable_index」のフィールドと同じ値に設定される。従って、NALユニットのヘッダの「nuh_layer_id」の値がフレキシブルに割り当てられる場合であって、スケーラブル・リンケージSEIメッセージの「scalable_index」のフィールドが高品質フォーマット情報を構成する場合、このスケーラブル・リンケージ・デスクリプタの「scalable_index」のフィールドも同様の情報を構成することになる。
【0099】
「nuh_layer_id」の6ビットフィールドは、拡張ビデオストリームに含まれるレイヤID(layer ID)を示す。この「nuh_layer_id」のフィールドは、上述したNALユニットのヘッダの「nuh_layer_id」のフィールドと同じ値に設定される。従って、NALユニットのヘッダの「nuh_layer_id」の値が拡張ビデオストリームの符号化画像データに含まれる符号化成分の種類によって固定とされる場合であって、当該「nuh_layer_id」のフィールドが高品質フォーマット情報を構成する場合、このスケーラブル・リンケージ・デスクリプタの「nuh_layer_id」のフィールドも同様の情報を構成することになる。
【0100】
図19(a)は、NALユニットのヘッダの「nuh_layer_id」の値を符号化成分によって固定とする場合における各フィールドの値の一例を示している。この場合、NALユニットのヘッダの「nuh_layer_id」のフィールドは、高品質フォーマット情報を構成する。この場合には、スケーラブル・リンケージ・デスクリプタの「nuh_layer_id」のフィールドも、高品質フォーマット情報を構成する。この場合、スケーラブル・リンケージ・デスクリプタの「scalable_index」の値は、拡張ビデオストリームの符号化画像データに対応した高品質フォーマットを表してはいない。
【0101】
図19(b)は、NALユニットのヘッダの「nuh_layer_id」の値をフレキシブルに割り当てる場合における各フィールドの値の一例を示している。この場合、NALユニットのヘッダの「nuh_layer_id」のフィールドは、高品質フォーマット情報を構成しない。この場合、スケーラブル・リンケージSEIメッセージの「scalable_index」のフィールドが、高品質フォーマット情報を構成する。この場合には、スケーラブル・リンケージ・デスクリプタの「scalable_index」のフィールドも、高品質フォーマット情報を構成する。なお、図示していないが、このスケーラブル・リンケージ・デスクリプタに、上述したスケーラブル・リンケージSEIメッセージ(図9参照)と同様に、予測変換情報(ダイナミックレンジ変換情報)を含めることも考えられる。
【0102】
[トランスポートストリームTSの構成]
図20は、トランスポートストリームTSの構成例を示している。このトランスポートストリームTSには、基本ビデオストリームBSと拡張ビデオストリームESが含まれている。この構成例では、各ビデオストリームのPESパケット「video PES」が存在する。
【0103】
基本ビデオストリームBSのパケット識別子(PID)は例えばPID1とされている。この基本ビデオストリームBSには、基本フォーマット画像データの各ピクチャの符号化画像データが含まれている。この符号化画像データには、AUD、VPS、SPS、PPS、PSEI、SLICE、SSEI、EOSなどのNALユニットが存在する。
【0104】
また、拡張ビデオストリームESのパケット識別子(PID)は例えばPID2とされている。この拡張ビデオストリームESには、高品質フォーマット画像データの各ピクチャの符号化画像データが含まれている。この符号化画像データには、AUD、SPS、PPS、PSEI、SLICE、SSEI、EOSなどのNALユニットが存在する。
【0105】
例えば、NALユニットのヘッダの「nuh_layer_id」の値が符号化成分によって固定とされることで、この「nuh_layer_id」のフィールドは、高品質フォーマット情報を構成する。一方、NALユニットのヘッダの「nuh_layer_id」の値がフレキシブルに割り当てられる場合、高品質フォーマット情報を構成する「scalable_index」のフィールドを持つスケーラブル・リンケージSEIメッセージ(図9参照)が、アクセスユニット(AU)の“SEIs”の部分に挿入される。
【0106】
また、トランスポートストリームTSには、PSI(Program Specific Information)として、PMT(Program Map Table)が含まれている。このPSIは、トランスポートストリームに含まれる各エレメンタリストリームがどのプログラムに属しているかを記した情報である。
【0107】
PMTには、プログラム全体に関連する情報を記述するプログラム・ループ(Program loop)が存在する。また、PMTには、各エレメンタリストリームに関連した情報を持つエレメンタリストリームループが存在する。
【0108】
この構成例では、基本ビデオストリームBSと拡張ビデオストリームESにそれぞれ対応したビデオエレメンタリストリームループ(video ES loop)が存在する。基本ビデオストリームBSに対応したビデオエレメンタリストリームループには、ストリームタイプ(ST0)、パケット識別子(PID1)等の情報が配置されると共に、この拡張ビデオストリームESに関連する情報を記述するデスクリプタも配置される。
【0109】
また、拡張ビデオストリームESに対応したビデオエレメンタリストリームループには、ストリームタイプ(ST1)、パケット識別子(PID2)等の情報が配置されると共に、この拡張ビデオストリームESに関連する情報を記述するデスクリプタも配置される。このデスクリプタの一つとして、上述したスケーラブル・リンケージ・デスクリプタ(図18参照)が配置される。
【0110】
図2に示す送信装置100の動作を簡単に説明する。フレーム周波数が50HzのSDR画像データである基本フォーマット画像データVbは、光電変換部102に供給される。この光電変換部102では、基本フォーマット画像データVbに対して、SDR光電変換特性(SDR OETFカーブ)が適用されて、伝送用の基本フォーマット画像データVb´が得られる。この基本フォーマット画像データVb´は、RGB/YCbCr変換部103によりRGBドメインからYCbCr(輝度・色差)ドメインに変換された後に、ビデオエンコーダ106のエンコード部106b,106eに供給される。
【0111】
また、高品質フォーマット画像データVeは、光電変換部104に供給される。高品質フォーマット画像データVeは、(a)フレーム周波数が100HzのHDR画像データ、(b)フレーム周波数が50HzのHDR画像データ、あるいは(c)フレーム周波数が100HzのSDR画像データのいずれかである。
【0112】
光電変換部104では、高品質フォーマット画像データVeに対して、HDR光電変換特性(HDR OETFカーブ)あるいはSDR光電変換特性(SDR OETFカーブ)が適用されて、伝送用の高品質フォーマット画像データVe´が得られる。この高品質フォーマット画像データVe´は、RGB/YCbCr変換部105によりRGBドメインからYCbCr(輝度・色差)ドメインに変換された後に、ビデオエンコーダ106のエンコード部106eに供給される。
【0113】
エンコード部106bでは、伝送用の基本フォーマット画像データVb´に対してH.264/AVC、H.265/HEVCなどの予測符号化処理が施されて符号化画像データが得られ、この符号化ビデオデータを含む基本ビデオストリーム(ビデオエレメンタリストリーム)BSが生成される。この基本ビデオストリームBSは、システムエンコーダ107に供給される。
【0114】
エンコード部106eでは、伝送用の高品質フォーマット画像データVe´に対してH.264/AVC、H.265/HEVCなどの予測符号化処理が施されて符号化画像データが得られ、この符号化ビデオデータを含む拡張ビデオストリーム(ビデオエレメンタリストリーム)ESが生成される。この場合、エンコード部106eでは、予測残差を小さくするために、符号化ブロック毎に、画像データVe´内の予測、または画像データVb´との間の予測が、選択的に行われる。
【0115】
エンコード部106eでは、拡張ビデオストリームESに、高品質フォーマット情報が挿入される。例えば、この情報は、NALユニットのヘッダに挿入される。この場合、「nuh_layer_id」(図6参照)の値が符号化画像データに含まれる符号化成分の種類によって固定とされる。また、例えば、この情報は、SEI NALユニットの領域に挿入される。この場合、アクセスユニット(AU)の“SEIs”の部分に新規定義するスケーラブル・リンケージSEIメッセージ(図9参照)が挿入される。
【0116】
システムエンコーダ107では、ビデオエンコーダ106で生成された基本ビデオストリームBSおよび拡張ビデオストリームESに対してPESパケット化およびTSパケット化が施されて、トランスポートストリームTSが生成される。このとき、システムエンコーダ107では、コンテナとしてのトランスポートストリームTSに、高品質フォーマット情報が挿入される。すなわち、PMTの配下に存在する拡張ビデオストリームに対応したビデオエレメンタリストリームループ中に、新規定義するスケーラブル・リンケージ・デスクリプタ(図18参照)が配置される。
【0117】
システムエンコーダ107で生成されるトランスポートストリームTSは、送信部108に送られる。送信部108では、このトランスポートストリームTSが、放送波あるいはネットのパケットに載せて、受信装置200に送信される。
【0118】
「受信装置の構成」
図21は、受信装置200の構成例を示している。この受信装置200は、図2の送信装置100の構成例に対応したものである。この受信装置200は、制御部201と、受信部202と、システムデコーダ203と、ビデオデコーダ204と、YCbCr/RGB変換部105と、電光変換部206と、YCbCr/RGB変換部207と、電光変換部208と、表示部209を有している。
【0119】
制御部201は、CPU(Central Processing Unit)を備えて構成され、制御プログラムに基づいて、受信装置200の各部の動作を制御する。受信部202は、送信装置100から放送波あるいはネットのパケットに載せて送られてくるトランスポートストリームTSを受信する。システムデコーダ203は、このトランスポートストリームTSから、基本ビデオストリームBSと拡張ビデオストリームESを抽出する。
【0120】
また、システムデコーダ203は、コンテナとしてのトランスポートストリームTSに挿入されている種々の情報を抽出し、制御部201に送る。この情報には、上述した、スケーラブル・リンケージ・デスクリプタ(図18参照)も含まれる。制御部201は、このデスクリプタの「nuh_layer_id」のフィールド、あるいは「scalable_index」のフィールドに基づいて、拡張ビデオストリームESの符号化画像データに含まれている符号化成分の種類を認識する。すなわち、制御部201は、HDRでHFRの符号化成分が含まれるか、HDRでLFRの符号化成分が含まれるか、あるいはSDRでHFRの符号化成分が含まれるかを認識し、受信・表示システムの構成によってデコード対象を選択する。
【0121】
ビデオデコーダ204は、デコード部204bおよびデコード部204eを有する。デコード部204bは、基本ビデオストリームBSに対してデコード処理を施して、基本フォーマット画像データVb´を生成する。この場合、デコード部204bは、画像データVb´内で予測補償を行う。
【0122】
デコード部204eは、拡張ビデオストリームESに対してデコード処理を施して、高品質フォーマット画像データVe´を生成する。この場合、デコード部204eは、符号化時における予測に対応させて、符号化ブロック毎に、画像データVe´内の予測補償、または画像データVb´との間の予測補償を行う。
【0123】
図22は、デコード部204eの主要部の構成例を示している。このデコード部204eは、図4のエンコード部106eの処理とは逆の処理を行う。このデコード部204eは、デコード機能部241と、レイヤ内予測補償部242と、レイヤ間予測補償部243と、予測調整部244と、選択部245を有している。
【0124】
デコード機能部241は、符号化画像データCVに対して、予測補償以外のデコード処理を行って予測残差データを得る。レイヤ内予測補償部242は、予測残差データに対して、画像データV1内での予測補償(レイヤ内予測補償)を行って、画像データV1を得る。レイヤ間予測補償部243は、予測残差データに対して、参照対象の画像データV2との間での予測補償(レイヤ間予測補償)を行って、画像データV1を得る。
【0125】
予測調整部244は、詳細説明は省略するが、図4のエンコード部106eの予測調整部163と同様に、画像データV1の、画像データV2に対するスケーラブル拡張のタイプに応じた処理を行う。選択部245は、符号化時における予測に対応させて、符号化ブロック毎に、レイヤ内予測補償部242で得られる画像データV1、またはレイヤ間予測補償部243で得られる画像データV1を選択的に取り出して、出力とする。
【0126】
図21に戻って、デコード部204eは、拡張ビデオストリームESを構成する各アクセスユニットに挿入されているパラメータセットやSEIメッセージなどを抽出し、制御部201に送る。制御部201は、NALユニットのヘッダの「nuh_layer_id」のフィールド、あるいはスケーラブル・リンケージSEIメッセージの「scalable_index」のフィールドから、拡張ビデオストリームESの符号化画像データが対応する高品質フォーマットを認識する。
【0127】
上述したように、制御部201は、スケーラブル・リンケージ・デスクリプタの「nuh_layer_id」のフィールド、あるいは「scalable_index」のフィールドによっても、拡張ビデオストリームESの符号化画像データに含まれている符号化成分の種類を認識する。しかし、デスクリプタのようなコンテナレベルの識別情報は、ビデオのフレーム単位の動的な変化に追従できない。NALユニットのヘッダの「nuh_layer_id」のフィールド、あるいはスケーラブル・リンケージSEIメッセージの「scalable_index」のフィールドから拡張ビデオストリームESの符号化画像データに含まれている符号化成分の種類を認識することで、フレーム単位の動的な変化に追従できる。
【0128】
また、制御部201は、スケーラブル・リンケージSEIメッセージの「scalable_index」のフィールドから、予測調整のための変換テーブル情報を認識する。制御部201は、当該変換テーブルを予測調整部244に設定する。これにより、予測調整部244において、送信側における予測調整部163と同様のレベル調整(ダイナミックレンジ変換)を確実に行わせることが可能となる。
【0129】
YCbCr/RGB変換部105は、デコード部204bで得られる基本フォーマット画像データVb´を、YCbCr(輝度・色差)ドメインからRGBドメインに変換する。電光変換部206は、RGBドメインに変換された基本フォーマット画像データVb´に、上述した送信装置100における光電変換部102とは逆特性の電光変換を施し、基本フォーマット画像データVbを得る。この基本フォーマット画像データは、フレーム周波数が50HzのSDR画像データである。
【0130】
YCbCr/RGB変換部207は、デコード部204eで得られる高品質フォーマット画像データVe´を、YCbCr(輝度・色差)ドメインからRGBドメインに変換する。電光変換部208は、RGBドメインに変換された高品質フォーマット画像データVe´に、上述した送信装置100における光電変換部104とは逆特性の電光変換を施し、高品質フォーマット画像データVeを得る。
【0131】
この高品質フォーマット画像データは、(a)フレーム周波数が100Hz(HFR:ハイフレームレート)であるHDR画像データ、(b)フレーム周波数が50Hz(LFR)であるHDR画像データ、あるいは(c)フレーム周波数が100Hz(HFR)であるSDR画像データのいずれかである。
【0132】
表示部209は、例えば、LCD(Liquid Crystal Display)、有機EL(Organic Electro-Luminescence)パネル等で構成されている。表示部209は、表示能力に応じて、基本フォーマット画像データVb、高品質フォーマット画像データVeのいずれかによる画像を表示する。
【0133】
この場合、制御部201は、表示部209に供給すべき画像データ、つまり表示用画像データとして得られる画像データを制御する。この制御は、拡張ビデオストリームESの符号化画像データが対応する高品質フォーマットの情報、従って高品質フォーマット画像データVeの高品質フォーマットの情報と、表示部209の表示能力情報に基づいて、行われる。
【0134】
すなわち、表示部209が高品質フォーマット画像データVeによる画像表示が不可能である場合には、表示部209に基本フォーマット画像データVbが供給されるように制御する。一方、表示部209が高品質フォーマット画像データVeによる画像表示が可能である場合には、表示部209に高品質フォーマット画像データVeが供給されるように制御する。
【0135】
図21に示す受信装置200の動作を簡単に説明する。受信部202では、送信装置100から放送波あるいはネットのパケットに載せて送られてくるトランスポートストリームTSが受信される。このトランスポートストリームTSは、システムデコーダ203に供給される。システムデコーダ203では、このトランスポートストリームTSから基本ビデオストリームBSと拡張ビデオストリームESが抽出される。基本ビデオストリームBSは、デコード部204bに供給される。拡張ビデオストリームESは、デコード部204eに供給される。
【0136】
また、システムデコーダ203では、コンテナとしてのトランスポートストリームTSに挿入されている種々の情報が抽出され、制御部201に送られる。この情報には、スケーラブル・リンケージ・デスクリプタ(図18参照)も含まれる。制御部201では、このデスクリプタの「nuh_layer_id」のフィールド、あるいは「scalable_index」のフィールドに基づいて、拡張ビデオストリームESの符号化画像データが対応する高品質フォーマットが認識される。
【0137】
デコード部204bでは、基本ビデオストリームBSに対してデコード処理が施されて、基本フォーマット画像データVb´が生成される。この場合、デコード部204bでは、画像データVb´内で予測補償が行われる。デコード部204eでは、拡張ビデオストリームESに対してデコード処理が施されて、高品質フォーマット画像データVe´が生成される。この場合、デコード部204eでは、符号化時における予測に対応させて、符号化ブロック毎に、画像データVe´内の予測補償、または画像データVb´との間の予測補償が行われる。
【0138】
また、デコード部204eでは、拡張ビデオストリームESを構成する各アクセスユニットに挿入されているパラメータセットやSEIメッセージなどが抽出され、制御部201に送られる。制御部201では、NALユニットのヘッダの「nuh_layer_id」のフィールド、あるいはスケーラブル・リンケージSEIメッセージの「scalable_index」のフィールドから、拡張ビデオストリームESの符号化画像データが対応する高品質フォーマットが、フレーム単位で認識される。
【0139】
デコード部204bで得られる基本フォーマット画像データVb´は、YCbCr/RGB変換部205でYCbCr(輝度・色差)ドメインからRGBドメインに変換されて、電光変換部206に供給される。電光変換部206では、RGBドメインに変換された基本フォーマット画像データVb´に、送信装置100における光電変換とは逆特性の電光変換が施されて、基本フォーマット画像データVbが得られる。
【0140】
デコード部204eで得られる高品質フォーマット画像データVe´は、YCbCr/RGB変換部207でYCbCr(輝度・色差)ドメインからRGBドメインに変換されて、電光変換部208に供給される。電光変換部208では、RGBドメインに変換された高品質フォーマット画像データVe´に、送信装置100における光電変換とは逆特性の電光変換が施されて、高品質フォーマット画像データVeが得られる。
【0141】
制御部201により、表示部209に供給すべき画像データ(表示用画像データ)が制御される。この制御は、拡張ビデオストリームESの符号化画像データが対応する高品質フォーマットの情報、従って高品質フォーマット画像データVeの高品質フォーマットの情報と、表示部209の表示能力情報に基づいて、行われる。
【0142】
表示部209が高品質フォーマット画像データVeによる画像表示が不可能である場合には、表示部209に基本フォーマット画像データVbが供給される。これにより、表示部209には、基本フォーマット(50Hで通常ダイナミックレンジ)の画像が表示される。一方、表示部209が高品質フォーマット画像データVeによる画像表示が可能である場合には、表示部209に高品質フォーマット画像データVeが供給される。これにより、表示部209には、高品質フォーマットの画像が表示される。
【0143】
以上説明したように、図1に示す送受信システム10においては、拡張ビデオストリームの符号化画像データが対応する高品質フォーマットを表す情報(高品質フォーマット情報)が拡張ビデオストリームおよび/またはコンテナに挿入されるものである。そのため、受信側では、高品質フォーマット画像データの高品質フォーマットを容易に認識可能となる。そして、受信側では、この情報および表示能力情報に基づいて、基本フォーマット画像データVbまたは高品質フォーマット画像データVeを表示用画像データとして選択して、表示能力にあった画像表示を容易に行い得る。
【0144】
<2.変形例>
なお、上述実施の形態においては、送信装置100と受信装置200とからなる送受信システム10を示したが、本技術を適用し得る送受信システムの構成は、これに限定されるものではない。例えば、受信装置200の部分が、HDMI(High-Definition Multimedia Interface)などのデジタルインタフェースで接続されたセットトップボックスおよびモニタの構成などであってもよい。この場合、セットトップボックスは、モニタからEDID(Extended display identification data)を取得する等して表示能力情報を得ることができる。なお、「HDMI」は、登録商標である。
【0145】
また、上述実施の形態においては、コンテナがトランスポートストリーム(MPEG-2 TS)である例を示した。しかし、本技術は、インターネット等のネットワークを利用して受信端末に配信される構成のシステムにも同様に適用できる。インターネットの配信では、MP4やそれ以外のフォーマットのコンテナで配信されることが多い。つまり、コンテナとしては、デジタル放送規格で採用されているトランスポートストリーム(MPEG-2 TS)、あるいは次世代トランスポートのMMT(MPEG Media Transpot)、インターネット配信で使用されているMP4などの種々のフォーマットのコンテナが該当する。
【0146】
また、本技術は、以下のような構成を取ることもできる。
(1)基本フォーマット画像データの符号化画像データを持つ基本ビデオストリームと、複数種類の中から選択された一つの種類の高品質フォーマットの画像データの符号化画像データを持つ拡張ビデオストリームの2つのビデオストリームを生成する画像符号化部と、
上記基本ビデオストリームおよび上記拡張ビデオストリームを含む所定フォーマットのコンテナを送信する送信部と、
上記拡張ビデオストリームおよび/またはコンテナに、上記ビデオストリームが持つ符号化画像データが対応する高品質フォーマットを表す情報を挿入する情報挿入部を備える
送信装置。
(2)上記画像符号化部は、
上記基本フォーマット画像データに関しては、該基本フォーマット画像データ内の予測符号化処理を行って符号化画像データを得、
上記高品質フォーマット画像データに関しては、該高品質フォーマット画像データ内の予測符号化処理または上記基本フォーマット画像データとの間の予測符号化処理を選択的に行って符号化画像データを得る
前記(1)に記載の送信装置。
(3)上記基本フォーマット画像データは、通常ダイナミックレンジおよびローフレームレートの画像データであり、
上記高品質フォーマット画像データは、ハイダイナミックレンジおよびハイフレームレートの画像データ、ハイダイナミックレンジおよびローフレームレートの画像データ、または通常ダイナミックレンジおよびハイフレームレートの画像データのいずれかであり、
上記高品質フォーマット画像データの符号化画像データは、通常ダイナミックレンジ画像データに対する差分情報によるハイダイナミックレンジ画像データの符号化成分および/またはローフレームレート画像データに対する差分情報によるハイフレームレート画像データの符号化成分を持つ
前記(2)に記載の送信装置。
(4)上記画像符号化部は、
上記通常ダイナミックレンジ画像データに対する差分情報を求めるとき、差分値を小さくするために上記通常ダイナミックレンジ画像データにダイナミックレンジ変換を行う
前記(3)に記載の送信装置。
(5)上記画像符号化部は、
上記通常ダイナミックレンジ画像データに、通常ダイナミックレンジ光電変換特性による変換データの値をハイダイナミックレンジ光電変換特性による変換データの値に変換するための変換情報に基づいて、上記ダイナミックレンジ変換を行う
前記(4)に記載の送信装置。
(6)上記情報挿入部は、
上記拡張ビデオストリームおよび/またはコンテナに、上記変換情報をさらに挿入する
前記(5)に記載の送信装置。
(7)上記画像符号化部は、
上記拡張ビデオストリームに含まれる各ピクチャの符号化画像データに付加されるデコードタイムスタンプが示す時刻を、上記基本ビデオストリームに含まれる各ピクチャの符号化画像データに付加されるデコードタイムスタンプが示す時刻と同じか中間とし、
上記基本ビデオストリームに含まれる各ピクチャの符号化画像データに付加されるデコードタイムスタンプが示す時刻の間隔を均等とし、
上記拡張ビデオストリームに含まれる各ピクチャの符号化画像データに付加されるデコードタイムスタンプが示す時刻の間隔を均等とする
前記(1)から(6)のいずれかに記載の送信装置。
(8)上記拡張ビデオストリームはNALユニット構造を有し、
上記情報挿入部は、上記拡張ビデオストリームが持つ符号化画像データが対応する高品質フォーマットを表す情報を、上記NALユニットのヘッダに挿入する
前記(1)から(7)のいずれかに記載の送信装置。
(9)上記拡張ビデオストリームはNALユニット構造を有し、
上記情報挿入部は、上記拡張ビデオストリームが持つ符号化画像データが対応する高品質フォーマットを表す情報を、SEI NALユニットの領域に挿入する
前記(1)から(7)のいずれかに記載の送信装置。
(10)上記コンテナはMPEG2-TSであり、
上記情報挿入部は、上記拡張ビデオストリームが持つ符号化画像データが対応する高品質フォーマットを表す情報を、プログラムマップテーブルの配下に存在する上記拡張ビデオストリームに対応したビデオエレメンタリストリームループ内に挿入する
前記(1)から(9)のいずれかに記載の送信装置。
(11)基本フォーマット画像データの符号化画像データを持つ基本ビデオストリームと、複数種類の中から選択された一つの高品質フォーマットの画像データの符号化画像データを持つ拡張ビデオストリームの2つのビデオストリームを生成する画像符号化ステップと、
送信部により、上記基本ビデオストリームおよび上記拡張ビデオストリームを含む所定フォーマットのコンテナを送信する送信ステップと、
上記拡張ビデオストリームおよび/またはコンテナに、上記高品質フォーマット画像データの符号化画像データが対応する高品質フォーマットを表す情報を挿入する情報挿入ステップを有する
送信方法。
(12)基本フォーマット画像データの符号化画像データを持つ基本ビデオストリームと、複数種類の中から選択された一つの高品質フォーマットの画像データの符号化画像データを持つ拡張ビデオストリームの2つのビデオストリームを含む所定フォーマットのコンテナを受信する受信部を備え、
上記拡張ビデオストリームおよび/またはコンテナに、上記高品質フォーマット画像データの符号化画像データが対応する高品質フォーマットを表す情報が挿入されており、
上記拡張ビデオストリームおよび/またはコンテナから上記情報を抽出する情報抽出部と、
上記抽出された情報および表示能力情報に基づいて、上記基本ビデオストリームおよび上記拡張ビデオストリームから表示能力に対応した画像データを表示用画像データとして得る処理部をさらに備える
受信装置。
(13)上記基本ビデオストリームに含まれる符号化画像データは、上記基本フォーマット画像データに対して、該基本フォーマット画像データ内の予測符号化処理が行われて生成されており、
上記拡張ビデオストリームに含まれる符号化画像データは、上記高品質フォーマット画像データに対して、該高品質フォーマット画像データ内の予測符号化処理または上記基本フォーマット画像データとの間の予測符号化処理が選択的に行われて生成されている
前記(12)に記載の受信装置。
(14)受信部により、基本フォーマット画像データの符号化画像データを持つ基本ビデオストリームと、複数種類の中から選択された一つの高品質フォーマットの画像データの符号化画像データを持つ拡張ビデオストリームの2つのビデオストリームを含む所定フォーマットのコンテナを受信する受信ステップを有し、
上記拡張ビデオストリームおよび/またはコンテナに、上記高品質フォーマット画像データの符号化画像データが対応する高品質フォーマットを表す情報が挿入されており、
上記拡張ビデオストリームおよび/またはコンテナから上記情報を抽出する情報抽出ステップと、
上記抽出された情報および表示能力情報に基づいて、上記基本ビデオストリームおよび上記拡張ビデオストリームから表示能力に対応した画像データを表示用画像データとして得る処理ステップをさらに有する
受信方法。
【0147】
本技術の主な特徴は、拡張ビデオストリームが持つ符号化画像データが対応する高品質フォーマットを表す情報を拡張ビデオストリームおよび/またはコンテナに挿入することで、受信側において拡張ビデオストリームが持つ符号化画像データが対応する高品質フォーマットを容易に認識可能としたことである(図20参照)。
【0148】
10・・・送受信システム
100・・・送信装置
101・・・制御部
102,104・・・光電変換部
103,105・・・RGB/YCbCR変換部
106・・・ビデオエンコーダ
106b,106e・・・エンコード部
107・・・システムエンコーダ
108・・・送信部
150・・・画像データ生成部
151・・・カメラ
152・・・変換部
161・・・レイヤ内予測部
162・・・レイヤ間予測部
163・・・予測調整部
164・・・選択部
165・・・エンコード機能部
200・・・受信装置
201・・・制御部
202・・・受信部
203・・・システムデコーダ
204・・・ビデオデコーダ
204b,204e・・・デコード部
205,207・・・YCbCr/RGB変換部
206,208・・・電光変換部
209・・・表示部
241・・・デコード機能部
242・・・レイヤ内予測補償部
243・・・レイヤ間予測補償部
244・・・予測調整部
245・・・選択部
図1
図2
図3
図4
図5
図6
図7
図8
図9
図10
図11
図12
図13
図14
図15
図16
図17
図18
図19
図20
図21
図22