IP Force 特許公報掲載プロジェクト 2022.1.31 β版

知財求人 - 知財ポータルサイト「IP Force」

▶ ソニー株式会社の特許一覧

(19)【発行国】日本国特許庁(JP)
(12)【公報種別】特許公報(B2)
(11)【特許番号】
(24)【登録日】2024-09-02
(45)【発行日】2024-09-10
(54)【発明の名称】送信方法および送信装置
(51)【国際特許分類】
   H04N 21/235 20110101AFI20240903BHJP
   H04N 21/236 20110101ALI20240903BHJP
【FI】
H04N21/235
H04N21/236
【請求項の数】 2
(21)【出願番号】P 2023061094
(22)【出願日】2023-04-05
(62)【分割の表示】P 2021145958の分割
【原出願日】2016-07-05
(65)【公開番号】P2023076613
(43)【公開日】2023-06-01
【審査請求日】2023-04-28
(31)【優先権主張番号】P 2015142497
(32)【優先日】2015-07-16
(33)【優先権主張国・地域又は機関】JP
(73)【特許権者】
【識別番号】000002185
【氏名又は名称】ソニーグループ株式会社
(74)【代理人】
【識別番号】100093241
【弁理士】
【氏名又は名称】宮田 正昭
(74)【代理人】
【識別番号】100101801
【弁理士】
【氏名又は名称】山田 英治
(74)【代理人】
【識別番号】100095496
【弁理士】
【氏名又は名称】佐々木 榮二
(74)【代理人】
【識別番号】100086531
【弁理士】
【氏名又は名称】澤田 俊夫
(74)【代理人】
【識別番号】110000763
【氏名又は名称】弁理士法人大同特許事務所
(72)【発明者】
【氏名】塚越 郁夫
【審査官】鈴木 隆夫
(56)【参考文献】
【文献】特許第7259901(JP,B2)
【文献】特許第5713142(JP,B1)
【文献】特開2012-169885(JP,A)
【文献】国際公開第2016/098790(WO,A1)
【文献】国際公開第2013/018517(WO,A1)
【文献】国際公開第2012/177874(WO,A2)
【文献】デジタル放送におけるデータ放送符号化方式と伝送方式 ARIB STD-B24,6.1版,一般社団法人電波産業会,2014年12月16日,(第三分冊)p.56-61、(第一分冊)p.6-7
(58)【調査した分野】(Int.Cl.,DB名)
H04N 21/00-21/858
(57)【特許請求の範囲】
【請求項1】
符号化ビデオデータと、表示タイミング情報を持つサブタイトルのテキスト情報と、該テキスト情報に関する制御情報とを含む伝送ストリームを生成する伝送ストリーム生成ステップと、
上記伝送ストリームを送信する送信ステップを有し、
上記サブタイトルのテキスト情報と該テキスト情報に関する制御情報は、サブタイトルの表示タイミングに関する情報とサブタイトルの表示状態制御に関する情報を含み、
上記サブタイトルのテキスト情報は、TTML、あるいはTTMLの派生フォーマットである
送信方法。
【請求項2】
符号化ビデオデータと、表示タイミング情報を持つサブタイトルのテキスト情報と、該テキスト情報に関する制御情報とを含む伝送ストリームを生成する伝送ストリーム生成部と、
上記伝送ストリームを送信する送信部を備え、
上記サブタイトルのテキスト情報と該テキスト情報に関する制御情報は、サブタイトルの表示タイミングに関する情報とサブタイトルの表示状態制御に関する情報を含み、
上記サブタイトルのテキスト情報は、TTML、あるいはTTMLの派生フォーマットである
送信装置。
【発明の詳細な説明】
【技術分野】
【0001】
本技術は、送信方法および送信装置に関する。
【背景技術】
【0002】
従来、例えば、DVB(Digital Video Broadcasting)の放送などでは、サブタイトル(字幕)の情報をビットマップデータで送信する運用が行われている。近時、サブタイトルの情報をテキストの文字コードで、つまりテキストベースで送信することが提案されている。この場合、受信側で解像度に応じたフォント展開がなされる。
【0003】
また、サブタイトルの情報をテキストベースで送信する場合、テキスト情報にタイミング情報を持たせることが提案されている。このテキスト情報として、例えば、W3C((World Wide Web Consortium)でTTML(Timed Text Markup Language)が提唱されている(特許文献1参照)。
【先行技術文献】
【特許文献】
【0004】
【文献】特開2012-169885号公報
【発明の概要】
【発明が解決しようとする課題】
【0005】
TTMLで表現されるサブタイトルのテキスト情報は、マークアップ言語(markup language)の形でファイルとして扱われる。この場合、各パラメータの転送順の制約がないことから、受信側では、重要なパラメータを取得するために、ファイル全体をスキャンするということが必要となる。
【0006】
本技術の目的は、受信側におけるサブタイトル表示のための処理負荷の軽減を図ることにある。
【課題を解決するための手段】
【0007】
本技術の概念は、
符号化ビデオデータを含むビデオストリームを生成するビデオエンコード部と、
表示タイミング情報を持つサブタイトルのテキスト情報と、該テキスト情報で示される複数の情報のうちの一部の情報に対応した情報を持つアブストラクト情報を含むサブタイトルストリームを生成するサブタイトルエンコード部と、
上記ビデオストリームと上記サブタイトルストリームを含む所定フォーマットのコンテナを送信する送信部を備える
送信装置にある。
【0008】
本技術において、ビデオエンコード部により、符号化ビデオデータを含むビデオストリームが生成される。サブタイトルエンコーダにより、表示タイミング情報を持つサブタイトルのテキスト情報と、このテキスト情報で示される複数の情報のうちの一部の情報に対応した情報を持つアブストラクト情報を含むサブタイトルストリームが生成される。例えば、サブタイトルのテキスト情報は、TTML、あるいはこのTTMLの派生フォーマットである、ようにされてもよい。そして、送信部により、ビデオストリームとサブタイトルストリームを含む所定フォーマットのコンテナが送信される。
【0009】
例えば、アブストラクト情報には、サブタイトルの表示タイミング情報が含まれる、ようにされてもよい。受信側では、サブタイトルのテキスト情報をスキャンすることなく、アブストラクト情報に含まれるサブタイトルの表示タイミング情報に基づいて、サブタイトルの表示タイミングを制御することが可能となる。
【0010】
この場合、例えば、サブタイトルの表示タイミング情報は、表示開始タイミングと表示期間の情報を持つ、ようにされてもよい。そして、この場合、サブタイトルストリームは、PESヘッダとPESペイロードとからなるPESパケットにより構成され、サブタイトルのテキスト情報とアブストラクト情報はPESペイロードに配置され、表示開始タイミングは、PESヘッダに挿入されているPTS(Presentation Time Stamp)からの表示オフセットで示される、ようにされてもよい。
【0011】
また、例えば、アブストラクト情報には、サブタイトルの表示状態を制御する表示制御情報が含まれる、ようにされてもよい。受信側では、サブタイトルのテキスト情報をスキャンすることなく、アブストラクト情報に含まれる表示制御情報に基づいて、サブタイトルの表示状態を制御することが可能となる。
【0012】
この場合、例えば、表示制御情報には、少なくともサブタイトルの表示位置、色域およびダイナミックレンジのうちのいずれかの情報が含まれる、ようにされてもよい。そして、この場合、例えば、表示制御情報には、対象ビデオの情報がさらに含まれる、ようにされてもよい。
【0013】
また、例えば、アブストラクト情報には、サブタイトルのテキスト情報の要素に変化があることを通知する通知情報が含まれる、ようにされてもよい。この通知情報により、受信側では、サブタイトルのテキスト情報の要素に変化があることを容易に認識でき、サブタイトルのテキスト情報の要素のスキャンを効率よく行うことが可能となる。
【0014】
また、例えば、サブタイトルエンコード部は、サブタイトルのテキスト情報とアブストラクト情報をセグメント化し、所定数のセグメントを持つサブタイトルストリームを生成する、ようにされてもよい。この場合、受信側では、サブタイトルストリームからアブストラクト情報を含むセグメントを抽出することで、アブストラクト情報を容易に取得可能となる。
【0015】
この場合、例えば、サブタイトルストリームには、アブストラクト情報のセグメントが最初に配置され、続いてサブタイトルのテキスト情報のセグメントが配置される、ようにされてもよい。このようにアブストラクト情報のセグメントが最初に配置されることで、受信側では、サブタイトルストリームからアブストラクト情報のセグメントの抽出を簡単かつ効率よく行い得る。
【0016】
このように本技術においては、サブタイトルストリームに、サブタイトルのテキスト情報と共に、そのテキスト情報に対応したアブストラクト情報を含めるものである。そのため、受信側では、アブストラクト情報を用いてサブタイトル表示のため処理を行うことができ、処理負荷の軽減を図ることが可能となる。
【0017】
また、本技術の他の概念は、
ビデオストリームとサブタイトルストリームを含む所定フォーマットのコンテナを受信する受信部を備え、
上記ビデオストリームは、符号化ビデオデータを含み、
上記サブタイトルストリームは、表示タイミング情報を持つサブタイトルのテキスト情報と、該テキスト情報で示される複数の情報のうちの一部の情報に対応した情報を持つアブストラクト情報を含み、
上記ビデオストリームをデコードしてビデオデータを得るビデオデコード処理と、上記サブタイトルストリームをデコードしてサブタイトルのビットマップデータを得ると共に、上記アブストラクト情報を抽出するサブタイトルデコード処理と、上記ビデオデータに上記サブタイトルのビットマップデータを重畳して表示用ビデオデータを得るビデオ重畳処理と、上記ビデオデータに重畳されるサブタイトルのビットマップデータを上記アブストラクト情報に基づいて処理するビットマップデータ処理を制御する制御部をさらに備える
受信装置にある。
【0018】
本技術において、ビデオストリームとサブタイトルストリームを含む所定フォーマットのコンテナが受信される。ビデオストリームには、符号化ビデオデータが含まれている。サブタイトルストリームには、表示タイミング情報を持つサブタイトルのテキスト情報と、このテキスト情報で示される複数の情報のうちの一部の情報に対応した情報を持つアブストラクト情報が含まれている。
【0019】
制御部により、ビデオデコード処理、サブタイトルデコード処理、ビデオ重畳処理およびビットマップデータ処理が制御される。ビデオデコード処理では、ビデオストリームがデコードされてビデオデータが得られる。また、サブタイトルデコード処理では、、サブタイトルストリームがデコードされて、サブタイトルのビットマップデータが得られると共に、アブストラクト情報が抽出される。
【0020】
ビデオ重畳処理では、ビデオデータにサブタイトルのビットマップデータが重畳されて表示用ビデオデータが得られる。ビットマップデータ処理では、ビデオデータに重畳されるサブタイトルのビットマップデータがアブストラクト情報に基づいて処理される。
【0021】
例えば、アブストラクト情報には、サブタイトルの表示タイミング情報が含まれており、ビットマップデータ処理では、ビデオデータへのサブタイトルのビットマップデータの重畳タイミングを、サブタイトルの表示タイミング情報に基づいて制御する、ようにされてもよい。
【0022】
また、例えば、アブストラクト情報には、サブタイトルの表示状態を制御する表示制御情報が含まれており、ビットマップデータ処理では、ビデオデータに重畳されるサブタイトルのビットマップの状態を表示制御情報に基づいて制御する、ようにされてもよい。
【0023】
このように本技術においては、ビデオデータに重畳されるサブタイトルのビットマップデータを、サブタイトルストリームから抽出されたアブストラクト情報に基づいて処理するものである。そのため、サブタイトル表示のための処理負荷の軽減を図ることが可能となる。
【0024】
また、本技術の他の概念は、
符号化ビデオデータを含むビデオストリームを生成するビデオエンコード部と、
表示タイミング情報を持つサブタイトルのテキスト情報の要素が配置された1つまたは複数のセグメントを生成し、該1つまたは複数のセグメントを含むサブタイトルストリームを生成するサブタイトルエンコード部と、
上記ビデオストリームと上記サブタイトルストリームを含む所定フォーマットのコンテナを送信する送信部を備える
送信装置にある。
【0025】
本技術において、ビデオエンコード部により、符号化ビデオデータを含むビデオストリームが生成される。サブタイトルエンコード部により、表示タイミング情報を持つサブタイトルのテキスト情報の要素が配置された1つまたは複数のセグメントが生成され、この1つまたは複数のセグメントを含むサブタイトルストリームが生成される。例えば、サブタイトルのテキスト情報は、TTML、あるいは該TTMLの派生フォーマットである、ようにされてもよい。送信部により、ビデオストリームとサブタイトルストリームを含む所定フォーマットのコンテナが送信される。
【0026】
このように本技術においては、表示タイミング情報を持つサブタイトルのテキスト情報をセグメント化してサブタイトルストリームに含めて送信するものである。そのため、受信側では、サブタイトルのテキスト情報の各要素の受信を良好に行うことが可能となる。
【0027】
なお、本技術において、例えば、サブタイトルエンコード部は、サブタイトルのテキスト情報の全ての要素が配置された1つのセグメントを生成する場合、セグメントのレイヤまたはそれに配置される要素のレイヤに、サブタイトルのテキスト情報の伝送順および/または更新の有無に関する情報を挿入する、ようにされてもよい。サブタイトルのテキスト情報の伝送順に関する情報が挿入されることで、受信側では、サブタイトルのテキスト情報の伝送順を認識できることから、デコード処理を効率よく行うことが可能となる。また、サブタイトルのテキスト情報の更新の有無に関する情報が挿入されることで、受信側では、サブタイトルのテキスト情報の更新の有無を容易に把握可能となる。
【発明の効果】
【0028】
本技術によれば、受信側におけるサブタイトル表示のための処理負荷の軽減を図ることができる。なお、本明細書に記載された効果はあくまで例示であって限定されるものではなく、また付加的な効果があってもよい。
【図面の簡単な説明】
【0029】
図1】実施の形態としての送受信システムの構成例を示すブロック図である。
図2】送信装置の構成例を示すブロック図である。
図3】光電変換特性の例を示す図である。
図4】ダイナミックレンジ・SEIメッセージの構造例と、その構造例における主要な情報の内容を示す図である。
図5】TTML構造を示す図である。
図6】TTML構造を示す図である。
図7】TTML構造のヘッダ(head)に存在するメタデータ(TTM:TTML Metadata)の構造例を示している。
図8】TTML構造のヘッダ(head)に存在するスタイリング(TTS:TTML Styling)の構造例を示す図である。
図9】TTML構造のヘッダ(head)に存在するスタイリング・エクステンション(TTSE:TTML Styling Extension)の構造例を示す図である。
図10】TTML構造のヘッダ(head)に存在するレイアウト(TTL:TTML layout)の構造例を示す図である。
図11】TTML構造のボディ(body)の構造例を示す図である。
図12】PESパケットの構成例を示す図である。
図13】PES内部のセグメント・インタフェースを示す図である。
図14】PESデータペイロードに配置される「TimedTextSubtitling_segments()」の構造例を示す図である。
図15】PESデータペイロードに配置される「TimedTextSubtitling_segments()」の他の構造例を示す図である。
図16】メタデータ(TTM)が配置されるTHMS(text_header_metadata_segment)の構造例を示す図である。
図17】スタイリング(TTS)が配置されるTHSS(text_header_styling_segment)の構造例を示す図である。
図18】スタイリング・エクステンション(TTML)が配置されるTHSES(text_header_styling_extension_segment)の構造例を示す図である。
図19】レイアウト(TTL)が配置されるTHLS(text_header_layout_segment)の構造例を示す図である。
図20】TTML構造のボディ(body)が配置されるTBS(text_body_segment)の構造例を示す図である。
図21】TTML構造のヘッダ(head)が配置されるTHAS(text_header_all_segment)の構造例を示す図である。
図22】TTML構造の全体が配置されるTWS(text whole segment)の構造例を示す図である。
図23】TTML構造の全体が配置されるTWS(text whole segment)の他の構造例を示す図である。
図24】アブストラクト情報が配置されたAPTS(abstract_parameter_TimedText_segment)の構造例を示す図(1/2)である。
図25】アブストラクト情報が配置されたAPTS(abstract_parameter_TimedText_segment)の構造例を示す図(2/2)である。
図26】APTSの構造例における主要な情報の内容を示す図(1/2)である。
図27】APTSの構造例における主要な情報の内容を示す図(2/2)である。
図28】TTMLをセグメント(Segment)に変換する場合における「PTS」、「start_time_offset」、「end_time_offset」を設定について説明するための図である。
図29】受信装置の構成例を示すブロック図である。
図30】サブタイトルデコーダの構成例を示すブロック図である。
図31】色域・輝度変換部の構成例を示す図である。
図32】輝度変換部に含まれる輝度信号Yに係る構成部の構成例を示す図である。
図33】輝度変換部の動作を模式的に表す図である。
図34】位置・サイズ変換部における位置変換を説明するための図である。
図35】位置・サイズ変換部におけるサイズ変換を説明するための図である。
図36】サブタイトルの時系列順の表示制御の一例を説明するための図である。
図37】サブタイトルの時系列順の表示制御の一例を説明するための図である。
【発明を実施するための形態】
【0030】
以下、発明を実施するための形態(以下、「実施の形態」とする)について説明する。なお、説明を以下の順序で行う。
1.実施の形態
2.変形例
【0031】
<1.実施の形態>
[送受信システムの構成例]
図1は、実施の形態としての送受信システム10の構成例を示している。この送受信システム10は、送信装置100と受信装置200により構成されている。
【0032】
送信装置100は、コンテナとしてのMPEG2のトランスポートストリームTSを生成し、このトランスポートストリームTSを放送波あるいはネットのパケットに載せて送信する。このトランスポートストリームTSには、符号化ビデオデータを持つビデオストリームが含まれる。
【0033】
また、このトランスポートストリームTSには、サブタイトルストリームが含まれている。このサブタイトルストリームには、表示タイミング情報を持つサブタイトル(字幕)のテキスト情報と、このテキスト情報で示される複数の情報のうちの一部の情報に対応した情報を持つアブストラクト情報が含まれている。この実施の形態において、テキスト情報は、例えば、W3C((World Wide Web Consortium)で提唱されているTTML(Timed Text Markup Language)である。
【0034】
この実施の形態において、アブストラクト情報には、サブタイトルの表示タイミング情報が含まれている。この表示タイミング情報は、表示開始タイミングと表示期間の情報を持っている。ここで、サブタイトルストリームは、PESヘッダとPESペイロードとからなるPESパケットにより構成され、サブタイトルのテキスト情報および表示タイミング情報はPESペイロードに配置され、例えば、表示開始タイミングは、PESヘッダに挿入されているPTSからの表示オフセットで示される。
【0035】
また、この実施の形態において、アブストラクト情報には、サブタイトルの表示状態を制御するための表示制御情報が含まれている。この実施の形態において、表示制御情報には、サブタイトルの表示位置、色域およびダイナミックレンジの情報が含まれている。また、この実施の形態において、アブストラクト情報には、対象ビデオの情報が含まれている。
【0036】
受信装置200は、送信装置100から放送波で送られてくるトランスポートストリームTSを受信する。このトランスポートストリームTSは、上述したように、符号化ビデオデータを含むビデオストリームと、サブタイトルのテキスト情報およびアブストラクト情報を含むサブタイトルストリームを有している。
【0037】
受信装置200は、ビデオストリームからビデオデータを得ると共に、サブタイトルストリームからサブタイトルのビットマップデータを得ると共に、アブストラクト情報を抽出する。受信装置200は、ビデオデータにサブタイトルのビットマップデータを重畳して表示用ビデオデータを得る。テレビ受信機200は、ビデオデータに重畳されるサブタイトルのビットマップデータを、アブストラクト情報に基づいて処理する。
【0038】
この実施の形態において、アブストラクト情報にはサブタイトルの表示タイミング情報が含まれており、受信装置200は、ビデオデータへのブタイトルのビットマップデータの重畳タイミングを、表示タイミング情報に基づいて制御する。また、この実施の形態において、アブストラクト情報にはサブタイトルの表示状態(表示位置、色域、ダイナミックレンジなど)を制御するための表示制御情報が含まれており、受信装置200は、サブタイトルのビットマップの状態を、表示制御情報に基づいて制御する。
【0039】
「送信装置の構成例」
図2は、送信装置100の構成例を示している。この送信装置100は、制御部101と、カメラ102と、ビデオ光電変換部103と、RGB/YCbCr変換部104と、ビデオエンコーダ105と、サブタイトル発生部106と、テキストフォーマット変換部107と、サブタイトルエンコーダ108と、システムエンコーダ109と、送信部110を有している。
【0040】
制御部101は、CPU(Central Processing Unit)を備えて構成され、制御プログラムに基づいて、送信装置100の各部の動作を制御する。カメラ102は、被写体を撮像して、HDR(High Dynamic Range)、あるいはSDR(Standard Dynamic Range)のビデオデータ(画像データ)を出力する。HDR画像は、SDR画像の白ピークの明るさを超える0~100%*N(Nは1より大きい数)、例えば0~1000%などのコントラスト比を持つ。ここで、100%のレベルは、例えば、白の輝度値100cd/m2に相当する。
【0041】
ビデオ光電変換部103は、カメラ102で得られたビデオデータに対して、光電変換を施して、伝送ビデオデータV1を得る。この場合、ビデオデータがSDRビデオデータである場合には、SDR光電変換特性を適用して光電変換し、SDR伝送ビデオデータ(SDR光電変換特性を持たせた伝送ビデオデータ)を得る。一方、ビデオデータがHDRビデオデータである場合には、HDR光電変換特性を適用して光電変換し、HDR伝送ビデオデータ(HDR光電変換特性を持たせた伝送ビデオデータ)を得る。
【0042】
RGB/YCbCr変換部104は、伝送ビデオデータをRGBドメインからYCbCr(輝度・色差)ドメインに変換する。ビデオエンコーダ105は、YCbCrドメインに変換された伝送ビデオデータV1に対して、例えば、MPEG4-AVCあるいはHEVCなどの符号化を施し、符号化ビデオデータを含むビデオストリーム(PESストリーム)VSを生成する。
【0043】
このとき、ビデオエンコーダ105は、アクセスユニット(AU)のSPS NALユニットのVUI(video usability information)の領域に、伝送ビデオデータV1が持つ光電変換特性に対応した電光変換特性を示す情報(transfer function)、伝送ビデオデータV1の色域を示す情報、リファレンスレベルを示す情報などのメタ情報を挿入する。
【0044】
また、ビデオエンコーダ105は、アクセスユニット(AU)の“SEIs”の部分に、伝送ビデオデータV1が持つ光電変換特性に対応した電光変換特性を示す情報(transfer function)、リファレンスレベルの情報などのメタ情報を持つ、新規定義するダイナミックレンジ・SEIメッセージ(Dynamic_range SEI message)を挿入する。
【0045】
ここで、ダイナミックレンジ・SEIメッセージに、電光変換特性を示す情報を持たせるのは、伝送ビデオデータV1がHDR伝送ビデオデータであっても、HDR光電変換特性がSDR光電変換特性と互換性を持つ場合、SPS NALユニットのVUIには、SDR光電変換特性に対応した電光変換特性(ガンマ特性)を示す情報が挿入されるので、VUI以外の場所にHDR光電変換特性に対応した電光変換特性を示す情報が必要となるからである。
【0046】
図3は光電変換特性の例を示している。この図において、横軸は入力輝度レベルを示し、縦軸は伝送符号値を示す。曲線aは、SDR光電変換特性の例を示している。また、曲線b1は、HDR光電変換特性の例(SDR光電変換特性と互換性を持たない)を示している。さらに、曲線b2は、HDR光電変換特性の例(SDR光電変換特性と互換性を持つ)を示している。この例の場合、入力輝度レベルが互換限界値までは、SDR光電変換特性と一致している。入力輝度レベルが互換限界値であるとき、伝送符号値は互換レベルとなる。
【0047】
また、ダイナミックレンジ・SEIメッセージに、リファレンスレベルの情報を持たせるのは、伝送ビデオデータV1がSDR伝送ビデオデータであるとき、SPS NALユニットのVUIにSDR光電変換特性に対応した電光変換特性(ガンマ特性)を示す情報が挿入されるが、リファレンスレベルを挿入することに関しては規格明記がないからである。
【0048】
図4(a)は、ダイナミックレンジ・SEIメッセージの構造例(Syntax)を示している。図4(b)は、その構造例における主要な情報の内容(Semantics)を示している。「Dynamic_range_cancel_flag」の1ビットのフラグ情報は、“Dynamic_range ”のメッセージをリフレッシュするかを示す。“0”はメッセージをリフレッシュすることを示し、“1”はメッセージをリフレッシュしないこと、つまり前のメッセージをそのまま維持することを示す。
【0049】
「Dynamic_range_cancel_flag」が“0”であるとき、以下のフィールドが存在する。「coded_data_bit_depth」の8ビットフィールドは、符号化画素ビット数を示す。「reference_level」の8ビットフィールドは、リファレンスレベルとしての基準輝度レベル値を示す。「modify_tf_flag」の1ビットフィールドは、VUI(video usability information)で示されるTransfer Function(TF)を修正するか否かを示す。“0”はVUIで示されるTFが対象であることを示し、“1”は本SEIの「transfer_function」で指定されるTFでVUIのTFを修正することを示す。「transfer_function」の8ビットフィールドは、伝送ビデオデータV1が持つ光電変換特性に対応した電光変換特性を示す。
【0050】
図2に戻って、サブタイトル発生部106は、サブタイトル情報としてのテキストデータ(文字コード)DTを発生する。テキストフォーマット変換部107は、テキストデータDTを入力し、所定フォーマットのサブタイトルのテキスト情報、この実施の形態においてはTTML(Timed Text Markup Language)を得る。
【0051】
図5は、TTML(Timed Text Markup Language)構造の一例を示している。TTMLは、XMLベースで記載される。なお、図6(a)も、TTML構造の一例を示している。この例のように、ルート・コンテナ(root container)の位置に、「tts:extent」でサブタイトルエリア(Subtitle area)を指定することも可能である。図6(b)は、「tts:extent=“1920px 1080px”」で指定される、水平1920ピクセル、垂直1080ピクセルのサブタイトルエリアを示している。
【0052】
TTMLは、ヘッダ(head)とボディ(body)からなっている。ヘッダ(head)には、メタデータ(metadata)、スタイリング(styling)、スタイリング・エクステンション(styling extension)、レイアウト(layout)などの各要素が存在する。図7は、メタデータ(TTM:TTML Metadata)の構造例を示している。このメタデータには、メタデータのタイトルの情報と、コピーライトの情報が含まれている。
【0053】
図8(a)は、スタイリング(TTS:TTML Styling)の構造例を示している。このスタイリングには、識別子(id)の他に、リージョン(Region)の位置、サイズ、カラー(color)、フォント(fontFamily)、フォントサイズ(fontSize)、テキストアラインメント(textAlign)などの情報が含まれている。
【0054】
「tts:origin」は、サブタイトルの表示領域であるリージョン(Region)の開始位置を画素数で指定する。この例では、「tts:origin“480px 600px”」であり、図8(b)に示すように、開始位置(矢印P参照)は(480,600)であることを示している。また、「tts:extent」は、リージョンの終了位置を開始位置からの水平方向、垂直方向のオフセット画素数で指定する。この例では、「tts:extent“560px 350px”」であり、図8(b)に示すように、終了位置(矢印Q参照)は(480+560,600+350)であることを示している。ここで、このオフセット画素数は、リージョンの水平、垂直のサイズに対応している。
【0055】
「tts:opacity=“1.0”」は、サブタイトル(字幕)と背景ビデオとの混合比を示す。例えば、“1.0”はサブタイトルを100%、背景ビデオを0%とすることを示し、“0.1”はサブタイトル(字幕)を0%、背景ビデオを100%とすることを示す。図示の例では、“1.0”とされている。
【0056】
図9は、スタイリング・エクステンション(TTML Styling Extension)の構造例を示している。このスタイリング・エクステンションには、識別子(id)の他に、色域(colorspace)、ダイナミックレンジ(dynamicrange)の情報が含まれている。色域情報は、サブタイトルの想定する色域を指定する。図示の例では、“ITUR2020”であることが示されている。ダイナミックレンジ情報は、サブタイトルの想定するダイナミックレンジがSDRであるかHDRであるかを指定する。図示の例では、SDRであることが示されている。
【0057】
図10は、レイアウト(region:TTML layout)の構造例を示している。このレイアウトには、サブタイトルを配置するリージョンの識別子(id)の他に、オフセット(padding)、バックグラウンドカラー(backgroundColor)、アラインメント(displayAlign)などの情報が含まれている。
【0058】
図11は、ボディ(body)の構造例を示している。図示の例では、サブタイトル1(subtitle 1)、サブタイトル2(subtitle 2)、サブタイトル3(subtitle 3)の3つのサブタイトルの情報が含まれている。サブタイトル毎に、表示開始タイミングと表示終了タイミングが記載されると共に、テキストデータが記載されている。例えば、サブタイトル1(subtitle 1)に関しては、表示開始タイミングが“T1”で、表示終了タイミングが“T3”であり、テキストデータが「ABC」とされている。
【0059】
図2に戻って、サブタイトルエンコーダ108は、テキストフォーマット変換部107で得られたTTMLを種々のセグメントに変換し、ペイロードにそれらのセグメントを配置したPESパケットで構成されるサブタイトルストリームSSを生成する。
【0060】
図12は、PESパケットの構成例を示している。PESヘッダ(PES header)には、PTS(Presentation Time Stamp)が含まれている。PESデータペイロード(PES data payload)には、APTS(abstract_parameter_TimedText_segment)、THMS(text_header_metadata_segment)、THSS(text header styling segment)、THSES(text_header_styling_extension_segment)、THLS(text_header_layout_segment)、TBS(text_body_segment)の各セグメントが含まれている。
【0061】
なお、PESデータペイロード(PES data payload)には、APTS(abstract_parameter_TimedText_segment)、THAS(text_header_all_segment)、TBS(text_body_segment)の各セグメントが含まれる場合もある。また、PESデータペイロード(PES data payload)には、APTS(abstract_parameter_TimedText_segment)、TWS(text_whole_segment)の各セグメントが含まれる場合もある。
【0062】
図13は、PES内部のセグメント・インタフェースを示している。「PES_data_field」は、PESパケットのPESデータペイロードのコンテナ部分を示している。「data_identifier」の8ビットフィールドは、上述のコンテナ部分で伝送するデータの種類を識別するIDを示す。従来のサブタイトル(ビットマップの場合)は、“0x20”で示すこととされているので、テキストの場合は新たな値、例えば“0x21”で識別することも可能である。
【0063】
「subtitle_stream_id」の8ビットフィールドは、サブタイトルストリームの種類を識別するIDを示す。テキスト情報を伝送するサブタイトルストリームの場合は新たな値、例えば“0x01”とし、従来のビットマップを伝送するサブタイトルストリーム“0x00”と区別することが可能である。
【0064】
「TimedTextSubtitling_segments()」のフィールドにセグメント群が配置される。図14は、APTS(abstract_parameter_TimedText_segment)、THMS(text_header_metadata_segment)、THSS(text header styling segment)、THSES(text_header_styling_extension_segment)、THLS(text_header_layout_segment)、TBS(text_body_segment)の各セグメントがPESデータペイロードに配置される場合における、「TimedTextSubtitling_segments()」の構造例を示している。
【0065】
図15(a)は、APTS(abstract_parameter_TimedText_segment)、THAS(text_header_all_segment)、TBS(text_body_segment)の各セグメントがPESデータペイロードに配置される場合における、「TimedTextSubtitling_segments()」の構造例を示している。図15(b)は、APTS(abstract_parameter_TimedText_segment)、TWS(text_whole_segment)の各セグメントがPESデータペイロードに配置される場合における、「TimedTextSubtitling_segments()」の構造例を示している。
【0066】
なお、各セグメントのサブタイトルストリームへの挿入の有無はフレキシブルであり、例えば、表示サブタイトル以外に変更がない場合は、APTS(abstract_parameter_TimedText_segment)、TBS(text_body_segment)の2つのセグメントのみの構成となる。いずれの場合においても、PESデータペイロードには、アブストラクト情報を持つAPTSのセグメントが最初に配置され、それに続いてその他のセグメントが配置される。このような配置とされることで、受信側では、サブタイトルストリームからアブストラクト情報のセグメントの抽出を簡単かつ効率よく行い得る。
【0067】
図16(a)は、THMS(text_header_metadata_segment)の構造例(syntax)を示している。この構造には、「sync_byte」、「segment_type」、「page_id」、「segment_length」、「thm_version_number」、「segment_payload()」の各情報が含まれている。「segment_type」は、セグメントタイプを示す8ビットのデータであり、ここでは、THMSを示す例えば「0x20」とされる。「segment_length」は、セグメントの長さ(サイズ)を示す8ビットのデータである。「segment_payload()」の中に、図16(b)に示すようなメタデータがXML情報として配置される。このメタデータは、TTMLのヘッダ(head)に存在するメタデータ(metadata)の要素と同じものである(図7参照)。
【0068】
図17(a)は、THSS(text_header_styling_segment)の構造例(syntax)を示している。この構造には、「sync_byte」、「segment_type」、「page_id」、「segment_length」、「ths_version_number」、「segment_payload()」の各情報が含まれている。「segment_type」は、セグメントタイプを示す8ビットのデータであり、ここでは、THSSを示す例えば「0x21」とされる。「segment_length」は、セグメントの長さ(サイズ)を示す8ビットのデータである。「segment_payload()」の中に、図17(b)に示すようなメタデータがXML情報として配置される。このメタデータは、TTMLのヘッダ(head)に存在するスタイリング(styling)の要素と同じものである(図8(a)参照)。
【0069】
図18(a)は、THSES(text_header_styling_extension_segment)の構造例(syntax)を示している。この構造には、「sync_byte」、「segment_type」、「page_id」、「segment_length」、「thse_version_number」、「segment_payload()」の各情報が含まれている。「segment_type」は、セグメントタイプを示す8ビットのデータであり、ここでは、THSESを示す例えば「0x22」とされる。「segment_length」は、セグメントの長さ(サイズ)を示す8ビットのデータである。「segment_payload()」の中に、図18(b)に示すようなメタデータがXML情報として配置される。このメタデータは、TTMLのヘッダ(head)に存在するスタイリング・エクステンション(styling_extension)の要素と同じものである(図9(a)参照)。
【0070】
図19(a)は、THLS(text_header_layout_segment)の構造例(syntax)を示している。この構造には、「sync_byte」、「segment_type」、「page_id」、「segment_length」、「thl_version_number」、「segment_payload()」の各情報が含まれている。「segment_type」は、セグメントタイプを示す8ビットのデータであり、ここでは、THLSを示す例えば「0x23」とされる。「segment_length」は、セグメントの長さ(サイズ)を示す8ビットのデータである。「segment_payload()」の中に、図19(b)に示すようなメタデータがXML情報として配置される。このメタデータは、TTMLのヘッダ(head)に存在するレイアウト(layout)の要素と同じものである(図10参照)。
【0071】
図20(a)は、TBS(text_body_segment)の構造例(syntax)を示している。この構造には、「sync_byte」、「segment_type」、「page_id」、「segment_length」、「tb_version_number」、「segment_payload()」の各情報が含まれている。「segment_type」は、セグメントタイプを示す8ビットのデータであり、ここでは、TBSを示す例えば「0x24」とされる。「segment_payload()」の中に、図20(b)に示すようなメタデータがXML情報として配置される。このメタデータは、TTMLのボディ(body)と同じものである(図11参照)。
【0072】
図21(a)は、THAS(text_header_all_segment)の構造例(syntax)を示している。この構造には、「sync_byte」、「segment_type」、「page_id」、「segment_length」、「tha_version_number」、「segment_payload()」の各情報が含まれている。「segment_type」は、セグメントタイプを示す8ビットのデータであり、ここでは、THASを示す例えば「0x25」とされる。「segment_length」は、セグメントの長さ(サイズ)を示す8ビットのデータである。「segment_payload()」の中に、図21(b)に示すようなメタデータがXML情報として配置される。このメタデータは、ヘッダ(head)の全体である。
【0073】
図22(a)は、TWS(text whole segment)の構造例(syntax)を示している。この構造には、「sync_byte」、「segment_type」、「page_id」、「segment_length」、「tw_version_number」、「segment_payload()」の各情報が含まれている。「segment_type」は、セグメントタイプを示す8ビットのデータであり、ここでは、TWSを示す例えば「0x26」とされる。「segment_length」は、セグメントの長さ(サイズ)を示す8ビットのデータである。「segment_payload()」の中に、図22(b)に示すようなメタデータがXML情報として配置される。このメタデータは、TTMLの全体である(図5参照)。この構造は、TTML全体での互換性を維持するための構造であって、TTML全体を一つのセグメントに入れるものである。
【0074】
このようにTTMLの全ての要素を1つのセグメントに配置して送る場合、図22(b)に示すように、要素のレイヤに、「ttnew:sequentialinorder」、「ttnew:partialupdate」の2つの新規要素が挿入される。なお、これらは、同時に挿入されなくてもよい。
【0075】
「ttnew:sequentialinorder」は、TTMLの伝送順に関する情報を構成する。この「ttnew:sequentialinorder」は、<head>の前に配置される。「ttnew:sequentialinorder=true (=1)」で伝送順の制約があることを示す。その場合は、<head> の中が、<metadata>、<styling>、<styling extension>、<layout> の順で配置され、その後に<body> の中身の“<div>、<p> text </p> </div> ” が続くことを示す。なお、<styling extension>が存在しない場合は、<metadata>、<styling>、<layout> の順である。一方、「ttnew:sequentialinorder=false (=0)」で、上記制約がないことを示す。
【0076】
このように「ttnew:sequentialinorder」の要素が挿入されることで、受信側では、TTMLの伝送順を認識できることから、TTMLの全ての要素がまとめて送られてくる場合でも、TTMLの伝送順が所定の順序に則ってなされることを認識でき、デコードまでの過程が簡便になり、デコード処理を効率よく行うことが可能となる。
【0077】
また、「ttnew:partialupdate」は、TTMLの更新の有無に関する情報を構成する。この「ttnew:partialupdate」は、<head>の前に配置される。「ttnew:partialupdate=true (=1) 」で<body> の前に、<head> のいずれかの要素のアップデートが起こることを示す。一方、「ttnew:partialupdate=false (=0)」で、上記アップデートがないことを示す。このように「ttnew:sequentialinorder」の要素が挿入されることで、受信側では、TTMLの更新の有無を容易に把握可能となる。
【0078】
なお、上述では、「ttnew:sequentialinorder」、「ttnew:partialupdate」の2つの新規要素が要素のレイヤに挿入される例を示した。しかし、これらの新規要素が、図23(a)に示すように、セグメントのレイヤに挿入される例も考えられる。図23(b)は、その場合に、「segment_payload()」の中に配置されるメタデータ(XML情報)を示している。
【0079】
「APTS(abstract_parameter_TimedText_segment)のセグメント」
ここで、APTS(abstract_parameter_TimedText_segment)のセグメントについて説明する。このAPTSのセグメントには、アブストラクト情報が含まれる。このアブストラクト情報には、TTMLで示される複数の情報のうちの一部の情報に対応した情報を持っている。
【0080】
図24図25は、APTS(abstract_parameter_TimedText_segment)の構造例(syntax)を示している。図26図27は、その構造例における主要な情報の内容(Semantics)を示している。この構造には、他のセグメントと同様に、「sync_byte」、「segment_type」、「page_id」、「segment_length」の各情報が含まれている。「segment_type」は、セグメントタイプを示す8ビットのデータであり、ここでは、APTSを示す例えば「0x19」とされる。「segment_length」は、セグメントの長さ(サイズ)を示す8ビットのデータである。
【0081】
「APT_version_number」の4ビットフィールドは、APTS(abstract_parameter_TimedText_segment)の要素に以前に送られている内容との間に変化があるか否かを示し、変化がある場合には値を1つ増加する。「TTM_version_number」の4ビットフィールドは、THMS(text_header_metadata_segment)の要素に以前に送られている内容との間に変化があるか否かを示し、変化がある場合には値を1つ増加する。「TTS_version_number」の4ビットフィールドは、THSS(text_header_styling_segment)の要素に以前に送られている内容との間に変化があるか否かを示し、変化がある場合には値を1つ増加する。
【0082】
「TTSE_version_number」の4ビットフィールドは、THSES(text_header_styling_extension_segment)の要素に以前に送られている内容との間に変化があるか否かを示し、変化がある場合には値を1つ増加する。「TTL_version_number」の4ビットフィールドは、THLS(text_header_layout_segment)の要素に以前に送られている内容との間に変化があるか否かを示し、変化がある場合には値を1つ増加する。
【0083】
「TTHA_version_number」の4ビットフィールドは、THAS(text_header_all_segment)の要素に以前に送られている内容との間に変化があるか否かを示し、変化がある場合には値を1つ増加する。「TW_version_number」の4ビットフィールドは、TWS(text whole segment)の要素に以前に送られている内容との間に変化があるか否かを示し、変化がある場合には値を1つ増加する。
【0084】
「subtitle_display_area」の4ビットフィールドは、サブタイトル表示領域(サブタイトルエリア)を指定する。例えば、“0x1”は640h*480vを指定し、“0x2”は720h*480vを指定し、“0x3”は720h*576vを指定し、“0x4”は1280h*720vを指定し、“0x5”は1920h*1080vを指定し、“0x6”は3840h*2160vを指定し、“0x7”は7680h*4320vを指定する。
【0085】
「subtitle_color_gamut_info」の4ビットフィールドは、サブタイトルの想定する色域を指定する。「subtitle_dynamic_range_info」の4ビットフィールドは、サブタイトルの想定するダイナミックレンジを指定する。例えば、“0x1”はSDRを示し、“0x2”はHDRを示す。サブタイトルにHDRを指定する場合はサブタイトルの輝度をビデオの標準白レベル以下に抑えることを想定することを示す。
【0086】
「target_video_resolution」の4ビットフィールドは、想定するビデオの解像度を指定する。例えば、“0x1”は640h*480vを指定し、“0x2”は720h*480vを指定し、“0x3”は720h*576vを指定し、“0x4”は1280h*720vを指定し、“0x5”は1920h*1080vを指定し、“0x6”は3840h*2160vを指定し、“0x7”は7680h*4320vを指定する。
【0087】
「target_video_color_gamut_info」の4ビットフィールドは、想定するビデオの色域を指定する。例えば、“0x1”は「BT.709」を示し、“0x2”は「BT.2020」を示す。「target_video_dynamic_range_info」の4ビットフィールドは、想定するビデオのダイナミックレンジを指定する。例えば、“0x1”は「BT.709」を示し、“0x2”は「BT.202x」を示し、“0x3”は「Smpte 2084」を示す。
【0088】
「number_of_regions」の4ビットフィールドは、リージョンの数を指定する。リージョンの数だけ、以下のフィールドが繰り返し存在する。「region_id」の16ビットフィールドは、リージョンのIDを示す。
【0089】
「start_time_offset」の8ビットフィールドは、サブタイトルの表示開始時刻をPTSからのオフセット値として示す。この「start_time_offset」のオフセット値は、符号付きであり、負の値の場合はPTSよりも早い時点での表示開始を表す。この「start_time_offset」のオフセット値が0であるときは、PTSのタイミングで表示を開始することを意味する。8ビット表現の場合の値の精度は、符号値を10で割った、小数点第1位までになる。
【0090】
「end_time_offset」の8ビットフィールドは、サブタイトルの表示終了時刻を「start_time_offset」からのオフセット値として示す。このオフセット値は、表示期間を示す。上述の「start_time_offset」のオフセット値が0であるときは、PTSにこの「end_time_offset」のオフセット値を加えた値のタイミングで表示を終了することを示す。8ビット表現の場合の値の精度は、符号値を10で割った、小数点第1位までになる。
【0091】
なお、「start_time_offset」、「end_time_offset」は、PTSと同じ90kHz精度で伝送することも可能である。その場合には、「start_time_offset」、「end_time_offset」のそれぞれのフィールドとして32ビットの空間を確保することになる。
【0092】
サブタイトルエンコーダ108は、図28に示すように、TTMLをセグメント(Segment)に変換する際に、TTMLのボディ(body)に含まれる各サブタイトルの表示開始タイミング(begin)と表示終了タイミング(end)の記載に基づき、システム時刻情報(PCR、ビデオ・オーディオの同期時刻)を参照して、各サブタイトルの「PTS」、「start_time_offset」、「end_time_offset」を設定する。この際、サブタイトルエンコーダ108は、デコーダ・バッファ・モデルを使用し、受信側の動作が正しく行われるように検証しながら、「PTS」、「start_time_offset」、「end_time_offset」の設定を行うようにしてもよい。
【0093】
「region_start_horizontal」の16ビットフィールドは、上述の「subtitle_display_area」で指定されるサブタイトル表示領域の中のリージョンの左上端点(図8(b)のP点参照)の水平画素位置を示す。「region_start_vertical」の16ビットフィールドは、サブタイトル表示領域の中のリージョンの左上端点の垂直画素位置を示す。「region_end_horizontal」の16ビットフィールドは、サブタイトル表示領域の中のリージョンの右下端点(図8(b)のQ点参照)の水平画素位置を示す。「region_end_vertical」の16ビットフィールドは、サブタイトル表示領域の中のリージョンの右下端点の垂直画素位置を示す。
【0094】
図2に戻って、システムエンコーダ109は、ビデオエンコーダ105で生成されたビデオストリームVSと、サブタイトルエンコーダ108で生成されたサブタイトルストリームSSを含むトランスポートストリームTSを生成する。送信部110は、このトランスポートストリームTSを、放送波あるいはネットのパケットに載せて、受信装置200に送信する。
【0095】
図2に示す送信装置100の動作を簡単に説明する。カメラ102で撮像されて得られたビデオデータ(画像データ)は、ビデオ光電変換部103に供給される。ビデオ光電変換部103では、カメラ102で得られたビデオデータに対して、光電変換が施されて、伝送ビデオデータV1が得られる。
【0096】
この場合、ビデオデータがSDRビデオデータである場合には、SDR光電変換特性が適用されて光電変換が行われ、SDR伝送ビデオデータ(SDR光電変換特性を持たせた伝送ビデオデータ)が得られる。一方、ビデオデータがHDRビデオデータである場合には、HDR光電変換特性が適用されて光電変換が行われ、HDR伝送ビデオデータ(HDR光電変換特性を持たせた伝送ビデオデータ)が得られる。
【0097】
ビデオ光電変換部103で得られた伝送ビデオデータV1は、RGB/YCbCr変換部104でRGBドメインからYCbCr(輝度・色差)ドメインに変換された後に、ビデオエンコーダ105に供給される。ビデオエンコーダ105は、この伝送ビデオデータV1に対して、例えば、MPEG4-AVCあるいはHEVCなどの符号化が施されて、符号化ビデオデータを含むビデオストリーム(PESストリーム)VSが生成される。
【0098】
また、ビデオエンコーダ105では、アクセスユニット(AU)のSPS NALユニットのVUIの領域に、伝送ビデオデータV1が持つ光電変換特性に対応した電光変換特性を示す情報(transfer function)、伝送ビデオデータV1の色域を示す情報、リファレンスレベルを示す情報などのメタ情報が挿入される。
【0099】
また、ビデオエンコーダ105では、アクセスユニット(AU)の“SEIs”の部分に、伝送ビデオデータV1が持つ光電変換特性に対応した電光変換特性を示す情報(transfer function)、リファレンスレベルの情報などのメタ情報を持つ、新規定義するダイナミックレンジ・SEIメッセージ(図4参照)が挿入される。
【0100】
サブタイトル発生部106では、サブタイトル情報としてのテキストデータ(文字コード)DTが発生される。このテキストデータDTはテキストフォーマット変換部107に供給される。テキストフォーマット変換部107では、テキストデータDTに基づいて、表示タイミング情報を持つサブタイトルのテキスト情報、つまりTTMLに変換される(図3図4参照)。このTTMLは、サブタイトルエンコーダ108に供給される。
【0101】
サブタイトルエンコーダ108では、テキストフォーマット変換部107で得られたTTMLが種々のセグメントに変換され、ペイロードにそれらのセグメントが配置されたPESパケットで構成されるサブタイトルストリームSSが生成される。この場合、PESパケットのペイロードには、アブストラクト情報を持つAPTSのセグメント(図24-図27参照)が最初に配置され、続いてサブタイトルのテキスト情報を持つセグメントが配置される(図12参照)。
【0102】
ビデオエンコーダ105で生成されるビデオストリームVSは、システムエンコーダ109に供給される。サブタイトルエンコーダ108で生成されたサブタイトルストリームSSは、システムエンコーダ109に供給される。システムエンコーダ109では、ビデオストリームVSとサブタイトルストリームSSを含むトランスポートストリームTSが生成される。このトランスポートストリームTSは、送信部110により、放送波あるいはネットのパケットに載せて、受信装置200に送信される。
【0103】
「受信装置の構成例」
図29は、受信装置200の構成例を示している。この受信装置200は、制御部201と、ユーザ操作部202と、受信部203と、システムデコーダ204と、ビデオデコーダ205と、サブタイトルデコーダ206と、色域・輝度変換部207と、位置・サイズ変換部208を有している。また、受信装置200は、ビデオ重畳部209と、YCbCr/RGB変換部210と、電光変換部211と、表示マッピング部212と、CEモニタ213を有している。
【0104】
制御部201は、CPU(Central Processing Unit)を備えて構成され、制御プログラムに基づいて、受信装置200の各部の動作を制御する。ユーザ操作部202は、視聴者などのユーザが種々の操作を行うためのスイッチ、タッチパネル、リモコン送信部などである。受信部203は、送信装置100から放送波あるいはネットのパケットに載せて送られてくるトランスポートストリームTSを受信する。
【0105】
システムデコーダ204は、このトランスポートストリームTSから、ビデオストリームVSとサブタイトルストリームSSを抽出する。また、システムデコーダ204は、トランスポートストリームTS(コンテナ)に挿入されている種々の情報を抽出し、制御部201に送る。
【0106】
ビデオデコーダ205は、システムデコーダ204で抽出されるビデオストリームVSに対してデコード処理を行って、伝送ビデオデータV1を出力する。また、ビデオデコーダ205は、ビデオストリームVSを構成する各アクセスユニットに挿入されているパラメータセットやSEIメッセージを抽出し、制御部201に送る。
【0107】
SPS NALユニットのVUIの領域には、伝送ビデオデータV1が持つ光電変換特性に対応した電光変換特性を示す情報(transfer function)、伝送ビデオデータV1の色域を示す情報、リファレンスレベルを示す情報などが挿入されている。また、このSEIメッセージには、伝送ビデオデータV1が持つ光電変換特性に対応した電光変換特性を示す情報(transfer function)、リファレンスレベルの情報などを持つダイナミックレンジSEIメッセージ(図4参照)も含まれる。
【0108】
サブタイトルデコーダ206は、サブタイトルストリームSSに含まれている各リージョンのセグメントデータを処理し、ビデオデータに重畳すべき各リージョンのビットマップデータを出力する。また、このサブタイトルデコーダ206は、APTSのセグメントに含まれるアブストラクト情報を抽出し、制御部201に送る。
【0109】
このアブストラクト情報には、サブタイトルの表示タイミング情報、サブタイトルの表示制御情報(サブタイトルの表示位置、色域およびダイナミックレンジの情報)、さらには、対象ビデオの情報(解像度、色域、ダイナミックレンジの情報)などが含まれている。
【0110】
ここで、サブタイトルの表示タイミング情報や表示制御情報は、APTS以外のセグメントの「segment_payload()」の中に配置されるXML情報に含まれているので、そのXML情報をスキャンすることでも得ることが可能であるが、APTSのセグメントからアブストラクト情報を抽出だけで容易に得ることができる。なお、対象ビデオの情報(解像度、色域、ダイナミックレンジの情報)は、ビデオストリームVSの系から取得可能であるが、APTSのセグメントからアブストラクト情報を抽出するだけで容易に得ることができる。
【0111】
図30は、サブタイトルデコーダ206の構成例を示している。このサブタイトルデコーダ206は、コーデッドバッファ261と、サブタイトルセグメントデコーダ262と、フォント展開部263と、ビットマップバッファ264を有している。
【0112】
コーデッドバッファ261は、サブタイトルストリームSSを一時的に保持する。サブタイトルセグメントデコーダ262は、コーデッドバッファ261に保持されている各リージョンのセグメントデータに対して所定のタイミングでデコード処理を施して、各リージョンのテキストデータや制御コードを得る。
【0113】
フォント展開部263は、サブタイトルセグメントデコーダ262で得られた各リージョンのテキストデータや制御コードに基づいてフォント展開して、各リージョンのサブタイトルのビットマップデータを得る。この場合、フォント展開部263は、各リージョンの位置情報として、例えば、アブストラクト情報に含まれる位置情報(「region_start_horizontal」、「region_start_vertical」、「region_end_horizontal」、「region_end_vertical」)を用いる。
【0114】
このサブタイトルのビットマップデータはRGBのドメインで得られる。また、このサブタイトルのビットマップデータの色域は、アブストラクト情報に含まれるサブタイトルの色域情報で示される色域に合致したものとされる。さらに、このサブタイトルのビットマップデータのダイナミックレンジは、アブストラクト情報に含まれるサブタイトルのダイナミックレンジ情報で示されるダイナミックレンジに合致したものとされる。
【0115】
例えば、ダイナミックレンジ情報が“SDR”であった場合、サブタイトルのビットマップデータは、ダイナミックレンジがSDRであって、SDR光電変換特性が適用されて光電変換がされたものとされる。また、例えば、ダイナミックレンジ情報が“HDR”であった場合、サブタイトルのビットマップデータは、ダイナミックレンジがHDRであって、HDR光電変換特性が適用されて光電変換がされたものとされる。この場合、HDRのビデオへの重畳を前提に、HDRのリファレンスレベルまでの輝度範囲に限定される。
【0116】
ビットマップバッファ264は、フォント展開部263で得られた各リージョンのビットマップデータを一時的に保持する。このビットマップバッファ264に保持されている各リージョンのビットマップデータは、表示開始タイミングから読み出されて画像データに重畳され、それが表示期間だけ継続される。
【0117】
ここで、サブタイトルセグメントデコーダ262は、PESパケットのPESヘッダからPTSを抽出する。また、サブタイトルセグメントデコーダ262は、APTSのセグメントからアブストラクト情報を抽出する。これらの情報は、制御部201に送られる。制御部201は、PTSと、アブストラクト情報に含まれる「start_time_offset」、「end_time_offset」の情報に基づいて、ビットマップバッファ264からの各リージョンのビットマップデータの読み出しタイミングを制御する。
【0118】
図29に戻って、色域・輝度変換部207は、制御部201の制御のもと、サブタイトルのビットマップデータの色域情報(「subtitle_color_gamut_info」)とビデオデータの色域情報(「target_video_color_gamut_info」)に基づいて、サブタイトルのビットマップデータの色域を、ビデオデータの色域に合わせる。また、色域・輝度変換部207は、制御部201の制御のもと、サブタイトルのビットマップデータのダイナミックレンジ情報(「subtitle_dynamic_range_info」)とビデオデータのダイナミックレンジ情報(「target_video_dynamic_range_info」)に基づいて、サブタイトルのビットマップデータの輝度の最大レベルがビデオデータの輝度のリファレンスレベル以下となるように調整する。
【0119】
図31は、色域・輝度変換部207の構成例を示している。この色域輝度変換部210は、電光変換部221と、色域変換部222と、光電変換部223と、RGB/YCbCr変換部224と、輝度変換部225を有している。
【0120】
電光変換部221は、入力されたサブタイトルのビットマップデータに対して光電変換をする。ここで、サブタイトルのビットマップデータのダイナミックレンジがSDRであるとき、電光変換部221は、SDR電光変換特性を適用して電光変換を行ってリニアな状態にする。また、サブタイトルのビットマップデータのダイナミックレンジがHDRであるとき、電光変換部221は、HDR電光変換特性を適用して電光変換を行ってリニアな状態にする。なお、入力されたサブタイトルのビットマップデータが光電変換を施していないリニア状態にあることも考えられる。その場合、電光変換部221は不要となる。
【0121】
色域変換部222は、電光変換部221から出力されたサブタイトルのビットマップデータの色域をビデオデータの色域に合わせる。例えば、サブタイトルのビットマップデータの色域が“BT.709”であってビデオデータの色域が“BT.2020”であるとき、サブタイトルのビットマップデータの色域は“BT.709”から“BT.2020”に変換される。なお、サブタイトルのビットマップデータの色域がビデオデータの色域と同じであるとき、色域変換部222は、実質的に何もせずに、入力されたサブタイトルのビットマップデータをそのまま出力する。
【0122】
光電変換部223は、色域変換部222から出力されたサブタイトルのビットマップデータに対して、ビデオデータに適用されている光電変換特性と同じ光電変換特性を適用して、光電変換を行う。RGB/YCbCr変換部224は、光電変換部223から出力されたサブタイトルのビットマップデータを、RGBドメインからYCbCr(輝度・色差)ドメインに変換する。
【0123】
輝度変換部225は、RGB/YCbCr変換部224から出力されたサブタイトルのビットマップデータに対して、サブタイトルのビットマップデータの輝度の最大レベルがビデオデータの輝度のリファレンスレベル以下、あるいは、基準となるホワイトレベルとなるように調整を行って、出力ビットマップデータを得る。この場合、サブタイトルのビットマップデータがHDRビデオへのレンダリングを考慮してビットマップデータの輝度調整が既に行われている場合、ビデオデータがHDRであるときには、実質的に何もせずに、入力されたサブタイトルのビットマップデータをそのまま出力する。
【0124】
図32は、輝度変換部225に含まれる輝度信号Yに係る構成部225Yの構成例を示している。この構成部225Yは、符号化画素ビット数調整部231と、レベル調整部232を有している。
【0125】
符号化画素ビット数調整部231は、サブタイトルのビットマップデータの輝度信号Ysの符号化画素ビット数をビデオデータの符号化画素ビット数に合わせる。例えば、輝度信号Ysの符号化画素ビット数が“8bits”でビデオデータの符号化画素ビット数が“10bits”であるとき、輝度信号Ysの符号化画素ビット数が“8bits”から“10bits”に変換される。レベル調整部232は、符号化画素ビット数が合わせられた輝度信号Ysの最大レベルがビデオデータの輝度のリファレンスレベル以下、あるいは、リファレンス・ホワイトレベルとなるように調整して、出力輝度信号Ys´とする。
【0126】
図33は、図32に示す構成部225Yの動作を模式的に表している。図示の例は、ビデオデータがHDRである場合を示している。リファレンスレベル(reference level)は、非輝き部分と輝き部分の境界に当たる。
【0127】
符号化画素ビット数が合わせられた後の輝度信号Ysの最大レベル(sc_high)と最小レベル(sc_low)の間に、リファレンスレベルが存在する。この場合、最大レベル(sc_high)がリファレンスレベル以下となるように調整される。なお、この場合、クリップの方法では白潰れみたいな状態になるので、例えば、リニアにスケールダウンする方法が採用される。
【0128】
このように輝度信号Ysのレベルが調整されることで、サブタイトルのビットマップデータをビデオデータに重畳したとき、サブタイトルが背景ビデオに輝いて表示されることが防止されるので、画品質を高画質に保つことが可能となる。
【0129】
なお、上述では、輝度変換部225に含まれる、輝度信号Ysに係る構成部225Y(図32参照)について説明した。輝度変換部225では、色差信号Cb,Crに関しては、符号化画素ビット数をビデオデータの符号化画素ビット数に合わせる処理のみが行われる。例えば、8ビット空間から10ビット空間への変換は、ビット幅で表現される範囲の全体を100%とし、その中で中央値が基準とされて、基準値からプラス方向に50%、マイナス方向に50%の振れ幅となるように、変換される。
【0130】
図29に戻って、位置・サイズ変換部208は、色域・輝度変換部207で得られたサブタイトルのビットマップデータに対して、制御部201の制御のもと、位置変換の処理を行う。位置・サイズ変換部208は、サブタイトルの対応解像度(「subtitle_display_area」の情報で示される)がビデオの解像度(「target_video_resolution」)と異なるとき、サブタイトルが背景ビデオの適切な位置に表示されるように、サブタイトルの位置変換をする。
【0131】
例えば、サブタイトルがHD解像度対応で、ビデオがUHD解像度である場合について説明する。ここで、UHD解像度は、HD解像度を越えるものであり、4K解像度あるいは8K解像度を含むものである。
【0132】
図34(a)は、ビデオがUHD解像度で、サブタイトルがHD解像度対応である場合の例を示している。サブタイトルの表示領域は、図中の“subtitle area”で表される。“subtitle area”とビデオの位置関係は、双方の基準位置、つまり、左上(left-top)を共有させたもので表されることとする。リージョンの開始点の画素位置は(a,b)、その終了点の画素位置は(c,d)となっている。この場合、背景ビデオの解像度がサブタイトルの対応解像度より大きいことから、背景ビデオ上のサブタイトルの表示位置は、制作側が意図した位置ではなく、右上に偏った状態となる。
【0133】
図34(b)は、位置変換処理を行った場合の例を示している。サブタイトルの表示領域であるリージョンの開始点の画素位置は(a´,b´)、その終了点の画素位置は(c´,d´)とされる。この場合、位置変換前のリージョンの位置座標はHD表示領域の座標であるので、ビデオ画枠との関係に応じて、従ってUHD解像度のHD解像度に対する比率に基づいてUHD表示領域の座標に変換される。なお、この例では、位置変換と同時に、サブタイトルのサイズ変換処理も行っている。
【0134】
また、位置・サイズ変換部208は、色域・輝度変換部207で得られたサブタイトルのビットマップデータに対して、制御部201の制御のもと、例えば、視聴者などのユーザの操作に応じて、あるいは、ビデオ解像度およびサブタイトルの対応解像度との関係から自動的に、サブタイトルのサイズ変換の処理を行う。
【0135】
図35(a)に示すように、表示領域の中心位置(dc: display center)からリージョン(region)の中心位置、つまりリージョンを水平・垂直方向に2分する点(region center位置: rc)までの距離はビデオの解像度に比例して決定される。例えば、ビデオの解像度としてHDが想定されてサブタイトルの表示領域の中心位置dcからリージョンの中心位置rcが定義される場合、ビデオの解像度が4K(=3840x2160)の際には、dcからrcまでの距離は画素数で2倍になるように位置の制御がなされる。
【0136】
図35(b)に示すように、リージョン(Region)のサイズをr_org(Region 00)からr_mod(Region 01)に変更した場合、開始位置(rsx1,rsy1)と終了位置(rex1,rey1)は、Ratio=(r_mod/r_org)を満足するように、それぞれ、開始位置(rsx2,rsy2)と終了位置(rex2,rey2)に修正される。
【0137】
つまり、rcから(rsx2,rsy2)までの距離とrcから(rsx1,rsy1)までの距離との比、およびrcから(rex2,rey2)までの距離とrcから(rex1,rey1)までの距離との比は、Ratioと整合するようにされる。このようにすることで、サイズ変換を行ってもリージョンの中心位置rcはそのままであり、表示領域全体の相対位置関係を一定に維持しつつ、サブタイトル(リージョン)のサイズ変換を行うことが可能となる。
【0138】
図29に戻って、ビデオ重畳部209は、ビデオデコーダ205から出力された伝送ビデオデータV1に、位置・サイズ変換部208から出力されたサブタイトルのビットマップデータを重畳する。この場合、ビデオ重畳部209は、サブタイトルのビットマップデータを、サブタイトルデコーダ206で得られた混合比情報(Mixing data)で示される混合比で混合する。
【0139】
YCbCr/RGB変換部210は、サブタイトルのビットマップデータが重畳された伝送ビデオデータV1´をYCbCr(輝度・色差)ドメインからRGBドメインに変換する。この場合、YCbCr/RGB変換部210は、色域情報に基づいて、色域に対応した変換式を用いて変換を行う。
【0140】
電光変換部211は、RGBドメインに変換された伝送ビデオデータV1´に、それに適用されている光電変換特性に対応した電光変換特性を適用して電光変換を行って、画像を表示するための表示用ビデオデータを得る。表示マッピング部212は、表示用ビデオデータに対して、CEモニタ213の最大輝度表示能力などに応じた表示輝度調整を行う。CEモニタ213は、表示輝度調整が行われた表示用ビデオデータに基づいて画像を表示する。このCEモニタ213は、例えば、LCD(Liquid Crystal Display)、有機ELディスプレイ(organic electroluminescence display)などで構成される。
【0141】
図29に示す受信装置200の動作を簡単に説明する。受信部203では、送信装置100から放送波あるいはネットのパケットに載せて送られてくるトランスポートストリームTSが受信される。このトランスポートストリームTSは、システムデコーダ204に供給される。システムデコーダ204では、このトランスポートストリームTSから、ビデオストリームVSおよびサブタイトルストリームSSが抽出される。また、システムデコーダ204では、トランスポートストリームTS(コンテナ)に挿入されている種々の情報が抽出され、制御部201に送られる。
【0142】
システムデコーダ204で抽出されたビデオストリームVSは、ビデオデコーダ205に供給される。ビデオデコーダ205では、ビデオストリームVSに対してデコード処理が施されて、伝送ビデオデータV1が得られる。また、ビデオデコーダ205では、ビデオストリームVSを構成する各アクセスユニットに挿入されているパラメータセットやSEIメッセージが抽出され、制御部201に送られる。
【0143】
SPS NALユニットのVUIの領域には、伝送ビデオデータV1が持つ光電変換特性に対応した電光変換特性を示す情報(transfer function)、伝送ビデオデータV1の色域を示す情報、リファレンスレベルを示す情報などが挿入されている。また、このSEIメッセージには、伝送ビデオデータV1が持つ光電変換特性に対応した電光変換特性を示す情報(transfer function)、リファレンスレベルの情報などを持つダイナミックレンジSEIメッセージ(図4参照)も含まれる。
【0144】
システムデコーダ204で抽出されたサブタイトルストリームSSは、サブタイトルデコーダ206に供給される。サブタイトルデコーダ206では、サブタイトルストリームSSに含まれている各リージョンのセグメントデータに対してデコード処理が施されて、ビデオデータに重畳すべき各リージョンのサブタイトルのビットマップデータが得られる。
【0145】
また、このサブタイトルデコーダ206では、APTSのセグメント(図24図25参照)に含まれるアブストラクト情報が抽出され、制御部201に送られる。このアブストラクト情報には、サブタイトルの表示タイミング情報、サブタイトルの表示制御情報(サブタイトルの表示位置、色域およびダイナミックレンジの情報)、さらには、対象ビデオの情報(解像度、色域、ダイナミックレンジの情報)などが含まれている。
【0146】
サブタイトルデコーダ206は、制御部201の制御のもと、例えば、アブストラクト情報に含まれるサブタイトルの表示タイミング情報(「start_time_offset」、「end_time_offset」)に基づいて、制御部201によって、各リージョンのサブタイトルのビットマップデータの出力タイミングが制御される。
【0147】
サブタイトルデコーダ206で得られた各リージョンのサブタイトルのビットマップデータは、色域・輝度変換部207に供給される。色域・輝度変換部207では、制御部201の制御のもと、例えば、アブストラクト情報に含まれる色域情報(「subtitle_color_gamut_info」、「target_video_color_gamut_info」)に基づいて、サブタイトルのビットマップデータの色域が、ビデオデータの色域に合わせられる。
【0148】
また、色域・輝度変換部207では、制御部201の制御のもと、例えば、アブストラクト情報に含まれるダイナミックレンジ情報(「subtitle_dynamic_range_info」、「target_video_dynamic_range_info」)に基づいて、サブタイトルのビットマップデータの輝度の最大レベルがビデオデータの輝度のリファレンスレベル以下となるように調整される。
【0149】
色域・輝度変換部207で得られた各リージョンのサブタイトルのビットマップデータは、位置・サイズ変換部208に供給される。位置・サイズ変換部208では、各リージョンのサブタイトルのビットマップデータに対して、制御部201の制御のもと、例えば、アブストラクト情報に含まれる解像度情報(「subtitle_display_area」、「target_video_resolution」)に基づいて、位置変換の処理が行われる。
【0150】
また、位置・サイズ変換部208では、色域・輝度変換部207で得られたサブタイトルのビットマップデータに対して、制御部201の制御のもと、例えば、視聴者などのユーザの操作に応じて、あるいは、ビデオ解像度およびサブタイトルの対応解像度との関係から自動的に、サブタイトルのサイズ変換の処理が行われる。
【0151】
ビデオデコーダ204で得られた伝送ビデオデータV1は、ビデオ重畳部209に供給される。また、位置・サイズ変換部208で得られた各リージョンのサブタイトルのビットマップデータは、ビデオ重畳部209に供給される。このビデオ重畳部209では、伝送ビデオデータV1に、各リージョンのサブタイトルのビットマップデータが重畳される。この場合、サブタイトルのビットマップデータが、混合比情報(Mixing data)で示される混合比で混合される。
【0152】
ビデオ重畳部209で得られた、各リージョンのサブタイトルのビットマップデータが重畳された伝送ビデオデータV1´は、YCbCr/RGB変換部210において、YCbCr(輝度・色差)ドメインからRGBドメインに変換されて、電光変換部211に供給される。電光変換部211では、伝送ビデオデータV1´に、それに適用されている光電変換特性に対応した電光変換特性が適用されて電光変換が行われ、画像を表示するための表示用ビデオデータが得られる。
【0153】
表示用ビデオデータは、表示マッピング部212に供給される。この表示マッピング部212では、表示用ビデオデータに対して、CEモニタ213の最大輝度表示能力などに応じた表示輝度調整が行われる。このように表示輝度調整が行われた表示用ビデオデータはCEモニタ213に供給される。CEモニタ213には、この表示用ビデオデータに基づいて画像が表示される。
【0154】
以上説明したように、図1に示す送受信システム10においては、サブタイトルストリームに、サブタイトルのテキスト情報と共に、そのテキスト情報に対応したアブストラクト情報を含めるものである。そのため、受信側では、アブストラクト情報を用いてサブタイトル表示のため処理を行うことができ、処理負荷の軽減を図ることが可能となる。
【0155】
この場合、受信側では、処理負荷が軽減されることから、サブタイトルの表示が比較的速く変化していく時系列順の表示制御にも容易に対処可能となる。例えば、図36(a)-(f)のようにサブタイトル表示が変化していく場合を考える。
【0156】
この場合、最初、例えば、図37(a)に示すように、APTS(abstract_parameter_TimedText_segment)とTBS(text body segment)のセグメントがPESデータペイロードに配置されたPESパケットを含むサブタイトルストリームSSが送信されてくる。受信側では、TBSのセグメントデータと、APTSのセグメントに含まれるリージョン位置情報(Region_position)に基づいて、当該リージョン“region r1” の位置に「ABC」の文言を表示するためのサブタイトルのビットマップデータを発生する。
【0157】
そして、受信側では、PTS1と、APTSのセグメントに含まれる表示タイミング情報(STS1,ETS1)に基づいて、表示開始タイミングT1から表示終了タイミングT3まで、このビットマップデータを出力する。これにより、受信側では、図36に示すように、T1からT3にかけて、画面上に「ABC」の文言の表示が継続して行われる。
【0158】
次に、例えば、図37(b)に示すように、APTS(abstract_parameter_TimedText_segment)とTBS(text body segment)のセグメントがPESデータペイロードに配置されたPESパケットを含むサブタイトルストリームSSが送信されてくる。受信側では、TBSのセグメントデータと、APTSのセグメントに含まれるリージョン位置情報(Region_position)に基づいて、当該リージョン“region r2” の位置に「DEF」の文言を表示するためのサブタイトルのビットマップデータを発生する。
【0159】
そして、受信側では、PTS2と、APTSのセグメントに含まれる表示タイミング情報(STS2,ETS2)に基づいて、表示開始タイミングT2から表示終了タイミングT5まで、このビットマップデータを出力する。これにより、受信側では、図36に示すように、T2からT5にかけて、画面上に「DEF」の文言の表示が継続して行われる。
【0160】
次に、例えば、図37(c)に示すように、APTS(abstract_parameter_TimedText_segment)とTBS(text body segment)のセグメントがPESデータペイロードに配置されたPESパケットを含むサブタイトルストリームSSが送信されてくる。受信側では、TBSのセグメントデータと、APTSのセグメントに含まれるリージョン位置情報(Region_position)に基づいて、当該リージョン“region r3” の位置に「GHI」の文言を表示するためのサブタイトルのビットマップデータを発生する。
【0161】
そして、受信側では、PTS3と、APTSのセグメントに含まれる表示タイミング情報(STS3,ETS3)に基づいて、表示開始タイミングT4から表示終了タイミングT6まで、このビットマップデータを出力する。これにより、受信側では、図36に示すように、T4からT6にかけて、画面上に「GHI」の文言の表示が継続して行われる。
【0162】
<2.変形例>
なお、上述実施の形態においては、表示タイミング情報を持つ所定フォーマットのサブタイトルのテキスト情報としてTTMLを用いる例を示した。しかし、本技術は、これに限定されず、TTMLと同等の情報を持つその他のタイムドテキスト情報を用いることも考えらえる。例えば、TTMLの派生フォーマットを用いてもよい。
【0163】
また、上述実施の形態においては、コンテナがトランスポートストリーム(MPEG-2 TS)である例を示した。しかし、本技術は、MPEG-2 TSのコンテナに限定されるものではなく、例えばMMTあるいは、ISOBMFFなど、その他のフォーマットのコンテナであっても同様に実現できる。
【0164】
また、上述実施の形態においては、TTMLおよびアブストラクト情報をセグメントに載せたうえでPESパケットのPESデータペイロードに配置する例を示した。しかし、本技術は、PESデータペイロードに、TTMLおよびアブストラクト情報を直接配置することも考えられる。
【0165】
また、上述実施の形態においては、送信装置100と受信装置200とからなる送受信システム10を示したが、本技術を適用し得る送受信システムの構成は、これに限定されるものではない。例えば、受信装置200の部分が、HDMI(High-Definition Multimedia Interface)などのデジタルインタフェースで接続されたセットトップボックスおよびモニタの構成などであってもよい。なお、「HDMI」は登録商標である。
【0166】
また、本技術は、以下のような構成を取ることもできる。
(1)符号化ビデオデータを含むビデオストリームを生成するビデオエンコード部と、
表示タイミング情報を持つサブタイトルのテキスト情報と、該テキスト情報で示される複数の情報のうちの一部の情報に対応した情報を持つアブストラクト情報を含むサブタイトルストリームを生成するサブタイトルエンコード部と、
上記ビデオストリームと上記サブタイトルストリームを含むコンテナを送信する送信部を備える
送信装置。
(2)上記アブストラクト情報には、サブタイトルの表示タイミング情報が含まれる
前記(1)に記載の送信装置。
(3)上記サブタイトルの表示タイミング情報は、表示開始タイミングと表示期間の情報を持つ
前記(2)に記載の送信装置。
(4)上記サブタイトルストリームは、PESヘッダとPESペイロードとからなるPESパケットにより構成され、
上記サブタイトルのテキスト情報と上記アブストラクト情報はPESペイロードに配置され、
上記表示開始タイミングは、上記PESヘッダに挿入されているPTSからの表示オフセットで示される
前記(3)に記載の送信装置。
(5)上記アブストラクト情報には、サブタイトルの表示状態を制御するための表示制御情報が含まれる
前記(1)から(4)のいずれかに記載の送信装置。
(6)上記表示制御情報には、少なくともサブタイトルの表示位置、色域およびダイナミックレンジのうちのいずれかの情報が含まれる
前記(5)に記載の送信装置。
(7)上記表示制御情報には、対象ビデオの情報がさらに含まれる
前記(6)に記載の送信装置。
(8)上記アブストラクト情報には、上記サブタイトルのテキスト情報の要素に変化があることを通知する通知情報が含まれる
前記(1)から(7)のいずれかに記載の送信装置。
(9)上記サブタイトルエンコード部は、
上記サブタイトルのテキスト情報と上記アブストラクト情報をセグメント化し、所定数のセグメントを持つ上記サブタイトルストリームを生成する
前記(1)から(8)のいずれかに記載の送信装置。
(10)上記サブタイトルストリームには、
上記アブストラクト情報のセグメントが最初に配置され、続いて上記サブタイトルのテキスト情報のセグメントが配置される
前記(9)に記載の送信装置。
(11)上記サブタイトルのテキスト情報は、TTML、あるいは該TTMLの派生フォーマットである
前記(1)から(10)のいずれかに記載の送信装置。
(12)符号化ビデオデータを含むビデオストリームを生成するビデオエンコードステップと、
表示タイミング情報を持つサブタイトルのテキスト情報と、該テキスト情報で示される複数の情報のうちの一部の情報に対応した情報を持つアブストラクト情報を含むサブタイトルストリームを生成するサブタイトルエンコードステップと、
送信部により、上記ビデオストリームと上記サブタイトルストリームを含むコンテナを送信する送信ステップを有する
送信方法。
(13)ビデオストリームとサブタイトルストリームを含む所定フォーマットのコンテナを受信する受信部を備え、
上記ビデオストリームは、符号化ビデオデータを含み、
上記サブタイトルストリームは、表示タイミング情報を持つサブタイトルのテキスト情報と、該テキスト情報で示される複数の情報のうちの一部の情報に対応した情報を持つアブストラクト情報を含み、
上記ビデオストリームにデコード処理を施してビデオデータを得るビデオデコード部と、
上記サブタイトルストリームにデコード処理を施してサブタイトルのビットマップデータを得ると共に、上記アブストラクト情報を抽出するサブタイトルデコード部と、
上記ビデオデータに上記サブタイトルのビットマップデータを重畳して表示用ビデオデータを得るビデオ重畳部と、
上記ビデオデータに重畳されるサブタイトルのビットマップデータを、上記アブストラクト情報に基づいて制御する制御部をさらに備える
受信装置。
(14)上記アブストラクト情報には、サブタイトルの表示タイミング情報が含まれており、
上記制御部は、
上記ビデオデータへの上記サブタイトルのビットマップデータの重畳タイミングを、上記サブタイトルの表示タイミング情報に基づいて制御する
前記(13)に記載の受信装置。
(15)上記アブストラクト情報には、サブタイトルの表示状態を制御するための表示制御情報が含まれており、
上記制御部は、
上記ビデオデータに重畳される上記サブタイトルのビットマップの状態を上記表示制御情報に基づいて制御する
前記(13)または(14)に記載の受信装置。
(16)受信部により、ビデオストリームとサブタイトルストリームを含む所定フォーマットのコンテナを受信する受信ステップを有し、
上記ビデオストリームは、符号化ビデオデータを含み、
上記サブタイトルストリームは、表示タイミング情報を持つサブタイトルのテキスト情報と、該テキスト情報で示される複数の情報のうちの一部の情報に対応した情報を持つアブストラクト情報を含み、
上記ビデオストリームにデコード処理を施してビデオデータを得るビデオデコードステップと、
上記サブタイトルストリームにデコード処理を施してサブタイトルのビットマップデータを得ると共に、上記アブストラクト情報を抽出するサブタイトルデコードステップと、
上記ビデオデータに上記サブタイトルのビットマップデータを重畳して表示用ビデオデータを得るビデオ重畳ステップと、
上記ビデオデータに重畳されるサブタイトルのビットマップデータを、上記アブストラクト情報に基づいて制御する制御ステップをさらに有する
受信方法。
(17)符号化ビデオデータを含むビデオストリームを生成するビデオエンコード部と、
表示タイミング情報を持つサブタイトルのテキスト情報の要素が配置された1つまたは複数のセグメントを生成し、該1つまたは複数のセグメントを含むサブタイトルストリームを生成するサブタイトルエンコード部と、
上記ビデオストリームと上記サブタイトルストリームを含む所定フォーマットのコンテナを送信する送信部を備える
送信装置。
(18)上記サブタイトルエンコード部は、
上記サブタイトルのテキスト情報の全ての要素が配置された1つのセグメントを生成する場合、
上記セグメントのレイヤまたは上記要素のレイヤに、上記サブタイトルのテキスト情報の伝送順および/または更新の有無に関する情報を挿入する
前記(17)に記載の送信装置。
(19)上記サブタイトルのテキスト情報は、TTML、あるいは該TTMLの派生フォーマットである
前記(17)または(18)に記載の送信装置。
(20)符号化ビデオデータを含むビデオストリームを生成するビデオエンコードステップと、
表示タイミング情報を持つサブタイトルのテキスト情報の要素が配置された1つまたは複数のセグメントを生成し、該1つまたは複数のセグメントを含むサブタイトルストリームを生成するサブタイトルエンコードステップと、
送信部により、上記ビデオストリームと上記サブタイトルストリームを含む所定フォーマットのコンテナを送信する送信ステップを有する
送信方法。
【0167】
本技術の主な特徴は、サブタイトルストリームにサブタイトルのテキスト情報と共に、そのテキスト情報に対応したアブストラクト情報を含めることで、受信側におけるサブタイトル表示のため処理の負荷の軽減を図るようにしたことである(図12参照)。
【符号の説明】
【0168】
10・・・送受信システム
100・・・送信装置
101・・・制御部
102・・・カメラ
103・・・ビデオ光電変換部
104・・・RGB/YCbCr変換部
105・・・ビデオエンコーダ
106・・・サブタイトル発生部
107・・・テキストフォーマット変換部
108・・・サブタイトルエンコーダ
109・・・システムエンコーダ
110・・・送信部
200・・・受信装置
201・・・制御部
202・・・ユーザ操作部
203・・・受信部
204・・・システムデコーダ
205・・・ビデオデコーダ
206・・・サブタイトルデコーダ
207・・・色域・輝度変換部
208・・・位置・サイズ変換部
209・・・ビデオ重畳部
210・・・YCbCr/RGB変換部
211・・・電光変換部
212・・・表示マッピング部
213・・・CEモニタ
221・・・電光変換部
222・・・色域変換部
223・・・光電変換部
224・・・RGB/YCbCr変換部
225・・・輝度変換部
225Y・・・構成部
231・・・符号化画素ビット数調整部
232・・・レベル調整部
261・・・コーデッドバッファ
262・・・サブタイトルセグメントデコーダ
263・・・フォント展開部
264・・・ビットマップバッファ
図1
図2
図3
図4
図5
図6
図7
図8
図9
図10
図11
図12
図13
図14
図15
図16
図17
図18
図19
図20
図21
図22
図23
図24
図25
図26
図27
図28
図29
図30
図31
図32
図33
図34
図35
図36
図37