(19)【発行国】日本国特許庁(JP)
(12)【公報種別】公開特許公報(A)
(11)【公開番号】P2023110197
(43)【公開日】2023-08-09
(54)【発明の名称】送信装置およびそのプログラム、並びに、受信装置およびそのプログラム
(51)【国際特許分類】
H04N 21/2362 20110101AFI20230802BHJP
H04N 21/236 20110101ALI20230802BHJP
H04N 21/434 20110101ALI20230802BHJP
H04H 20/28 20080101ALI20230802BHJP
【FI】
H04N21/2362
H04N21/236
H04N21/434
H04H20/28
【審査請求】未請求
【請求項の数】10
【出願形態】OL
(21)【出願番号】P 2022011488
(22)【出願日】2022-01-28
【公序良俗違反の表示】
(特許庁注:以下のものは登録商標)
1.JAVASCRIPT
(71)【出願人】
【識別番号】000004352
【氏名又は名称】日本放送協会
(74)【代理人】
【識別番号】110001807
【氏名又は名称】弁理士法人磯野国際特許商標事務所
(72)【発明者】
【氏名】大西 正芳
(72)【発明者】
【氏名】河村 侑輝
(72)【発明者】
【氏名】大槻 一博
(72)【発明者】
【氏名】兜森 椋
(72)【発明者】
【氏名】永田 裕靖
(72)【発明者】
【氏名】蛭間 信博
(72)【発明者】
【氏名】今村 浩一郎
【テーマコード(参考)】
5C164
【Fターム(参考)】
5C164FA04
5C164MB13S
5C164SB11P
5C164SB15P
5C164UB11P
(57)【要約】
【課題】放送波を送信する送信装置とそのプログラム、放送波を受信する受信装置とそのプログラムに、インターネットでよく利用されているテキスト形式のメッセージやファイルを含めて処理させる。
【解決手段】送信装置11は、放送番組の映像音声ストリームを含む信号パケットを送信する。この送信装置11は、放送番組の構成の定義または/および放送に関連する付加データであるテキストベースのサービスメタデータを映像音声ストリームに多重化する多重化部、を備える。
【選択図】
図1
【特許請求の範囲】
【請求項1】
放送番組の映像音声ストリームを含む信号パケットを送信する送信装置であって、
前記放送番組の構成の定義または/および放送に関連する付加データであるテキストベースのサービスメタデータを前記映像音声ストリームに多重化する多重化部、
を備えることを特徴とする送信装置。
【請求項2】
前記サービスメタデータは、前記映像音声ストリームのマニフェストファイルである、
ことを特徴とする請求項1に記載の送信装置。
【請求項3】
前記信号パケットは、所定のアプリケーションの構成ファイルを更に含み、
前記サービスメタデータは、前記所定のアプリケーションに紐付けられている、
ことを特徴とする請求項1または請求項2に記載の送信装置。
【請求項4】
前記サービスメタデータを圧縮する圧縮部を更に備える、
ことを特徴とする請求項1から請求項3のうち何れか1項に記載の送信装置。
【請求項5】
コンピュータを、
請求項1から請求項4のうち何れか1項に記載の送信装置として機能させるためのプログラム。
【請求項6】
放送番組の映像音声ストリームを含む信号パケットを受信する受信装置であって、
前記信号パケットから映像音声ストリームとテキストベースのサービスメタデータとを分離する分離部と、
前記分離部が分離したテキストベースの前記サービスメタデータに応じて、前記映像音声ストリームを配信する配信部と、
を備えることを特徴とする受信装置。
【請求項7】
前記サービスメタデータは、前記映像音声ストリームのマニフェストファイルである、
ことを特徴とする請求項6に記載の受信装置。
【請求項8】
前記信号パケットは、所定のアプリケーションの構成ファイルを更に含み、
前記サービスメタデータは、前記所定のアプリケーションに紐付けられている、
ことを特徴とする請求項6または請求項7に記載の受信装置。
【請求項9】
前記分離部が分離したテキストベースのサービスメタデータは圧縮されており、当該サービスメタデータの圧縮を展開する圧縮展開部を更に備える、
ことを特徴とする請求項6から請求項8のうち何れか1項に記載の受信装置。
【請求項10】
コンピュータを、
請求項6から請求項9のうち何れか1項に記載の受信装置として機能させるためのプログラム。
【発明の詳細な説明】
【技術分野】
【0001】
本発明は、送信装置およびそのプログラム、並びに、受信装置およびそのプログラムに関する。
【背景技術】
【0002】
放送システムが配信する放送データには放送番組の構成(映像、音声、字幕、アプリなど)の定義や放送に関連する付加データ(番組表など)を示す情報が多重化されている。この提案ではその情報をサービスメタデータと称する。
【0003】
現行のデジタル放送では、そのサービスメタデータをService Information(SI)という名称で規格化・運用している。
日本国内においてはBS4K8K放送においてMMT(MPEG Media Transport)というメディアトランスポート規格が運用されており、その中にMMT-SI(MPEG Media Transport-Signaling Information)という規格が存在する。(非特許文献1、2)
【0004】
図13を参照して、比較例の地上放送高度化の送受信システムを説明する。次世代の地上放送高度化では、放送規格と通信規格の親和性の高い送受信システムを検討している。
この送受信システムは、送信システム1と受信システム2を含んで構成される。送信システム1は、送信装置11を備えており、映像音声ストリームとMMT-SIとマニフェストファイルを含む情報を、放送波または通信回線を介して、受信システム2に配信する。ここでMMT-SIとは、制御情報(Signaling)から構成されるMMTP(MMT Package)パケットのことをいう。マニフェストファイルは、映像コンテンツを構成する映像や音声のデータの構成情報や再生制御に必要なメタデータを保持するものである。映像や音声のデータの構成情報には、そのデータを格納するフラグメントファイルに付与されるファイル名の規則を含む。
【0005】
受信システム2は、受信装置21と提示部22とを含んで構成される。受信装置21は、放送波または通信回線で映像音声ストリームとMMT-SIとマニフェストファイルを含む情報を受信して、配信サーバ214により提示部22に中継する。なお受信装置21は、配信サーバ214に加えて多重分離部211と、HTTP(Hypertext Transfer Protocol)クライアント212と、記憶部213とを含んで構成される。
【0006】
通信回線を介した動画配信では、MPEG-DASH(非特許文献3)、HLS(非特許文献4)、CMAF(非特許文献5)といったメディアフォーマットが多く利用されている。送信装置11は、通信回線を介して、これらのメディアフォーマットのうちの何れかで、映像音声ストリームとMMT-SIとマニフェストファイルを含む情報を、受信装置21に配信する。受信装置21のHTTPクライアント212は、この情報を受信してファイル化し、記憶部213に格納する。なおセグメントファイル2132は、映像音声ストリームとMMT-SIの情報とを含んで構成される。
【0007】
送信装置11は更に、これらのメディアフォーマットのうち何れかでエンコードされた情報を放送信号に多重化し、放送波を介して受信装置21に配信する。受信装置21の多重分離部211は、この情報を受信して映像音声ストリームとMMT-SIとマニフェストファイルに分離する。更に多重分離部211は、放送コンテンツをHTTPなどの通信規格で配信可能な形式に変換してファイル化し、記憶部213に格納する。多重分離部211は、信号パケットから映像音声ストリームとテキストベースのサービスメタデータとを分離する分離部として機能する。
【0008】
この受信装置21は、放送コンテンツをHTTPなどの通信規格で配信可能な形式に変換するゲートウェイとして機能する。具体的にいうと、受信装置21は、映像ストリームを記憶部213に格納し、マニフェストファイル2131とセグメントファイル2132を生成し、配信サーバ214で提示部22に配信する。提示部22は、ネット動画を視聴可能な端末であり、例えばスマートフォン、タブレット、コンピュータなどである。提示部22にはWebブラウザ221がインストールされており、このWebブラウザ221は、受信装置21から配信されたメディアフォーマットのコーデックを再生する。
【0009】
MPEG-DASH、HLSにおいてはメディアの構成情報はマニフェストファイルというテキスト形式のフォーマットで規定されている。
【先行技術文献】
【非特許文献】
【0010】
【非特許文献1】ARIB STD-B60、「デジタル放送におけるMMTによるメディアトランスポート方式」
【非特許文献2】ISO/IEC 23008-1、“High efficiency coding and media delivery in heterogeneous environments: MPEG media transport”
【非特許文献3】ISO/IEC 23009-1、“Information Technology - Dynamic Adaptive Streaming over HTTP (DASH)-Part 1: Media Presentation Description and Segment Formats”
【非特許文献4】RFC8216、“HTTP Live Streaming”、[online],August 2017,[令和4年1月7日検索]、インターネット<URL:https://tools.ietf.org/html/rfc8216>
【非特許文献5】ISO/IEC 23000-19 Information technology - Multimedia application format (MPEG-A) -Part 19:Common media application format (CMAF) for segmented media
【発明の概要】
【発明が解決しようとする課題】
【0011】
図14を参照して、比較例のMMTのパッケージ構造(メディアの構成)を説明する。パッケージ3には、アセット映像データ31と、アセット音声データ32が含まれており、MP(MMT Package)テーブル36によって規定される。このパッケージ3は、放送あるいは通信の伝送の単位である。MMTでは、コンテンツの単位をパッケージとして定義しており、このパッケージをサービスと一対一に対応付けて用いる。
【0012】
アセット映像データ31は、一連の映像コンテンツである複数のMPU(Media Processing Unit)311を含み、映像ストリームを構成する。映像信号の処理において、MPU311は処理の単位となる。同一のアセット映像データ31に属するMPU311には、同一のアセット識別子が付加され、更にMPU311ごとにシーケンス番号が付加されている。MPU311は、MMTPパケットで伝送される。
【0013】
アセット音声データ32は、音声ストリームを構成する。このようにMMTでは、映像や音声のコンポーネントをアセットと定義している。アセットはMPUが連続した構造である。
MPテーブル36は、MMTパッケージ識別子(MMT_package_id)と、複数のアセット識別子(asset_id)を含んでいる。MPテーブル36は、アセットのリストやその位置などパッケージ3を構成する情報を与える。なお、送信装置11は、
図14のパッケージ3を、放送用信号であるMMTPパケット4(
図15参照)に変換する。
【0014】
図15を参照して、比較例のMMTPによるMMT-SIの多重を説明する。MMTPパケット4は放送信号であり、MMTPヘッダ41と、MMTPペイロード42と、複数のMMT-SI43を含んでいる。
MMTPヘッダ41には、このMMTPパケット4やMMTPペイロード42を規定する情報が含まれている。
MMTPペイロード42には、映像データまたは/および音声データが格納されており、
図14に示したアセット映像データ31やアセット音声データ32を配信するために用いられる。
【0015】
MMT-SI43は、メッセージ431を含んでいる。メッセージ431は更に、テーブル4311を含んでいる。そして非特許文献1に記載されているように、MMT-SIを代表とする放送システムにおけるサービスメタデータは、バイナリ構造で規定されている。つまりMMT-SI43と、メッセージ431と、テーブル4311とを構成する制御情報の項目は、あらかじめ固定されたバイナリ構造として規定されている。
【0016】
このように、放送システムにおけるサービスメタデータは、一部にバイト長とデータ本体の組み合わせでテキスト情報を多重化している例はあるものの、その他の大部分はバイナリ構造で構成されている。
【0017】
上記比較例の課題として、テキスト形式のデータと比べて、バイナリ構造は拡張性に乏しいことが挙げられる。放送システムにおけるサービスメタデータには、テキスト形式のメッセージやファイルを多重化する汎用的な方式についての規定がない。つまり、放送システムにおけるサービスメタデータは、MPEG-DASHやHLS(HTTP Live Streaming)のマニフェストファイルや、そのほかXML(Extensible Markup Language)やJSON(JavaScript Object Notation)といったインターネットでよく利用されているテキスト形式のメッセージやファイルを含める方法が規定されていない。よって、送信装置に、インターネットでよく利用されているテキスト形式のメッセージやファイルを含めて放送波で配信させることは困難である。更に受信装置に、放送波を介して受信したデータに、インターネットでよく利用されているテキスト形式のメッセージやファイルを含めて処理させることも困難である。
【0018】
そこで、本発明は、放送波を送信する送信装置とそのプログラム、放送波を受信する受信装置とそのプログラムに、インターネットでよく利用されているテキスト形式のメッセージやファイルを含めて処理させることを課題とする。
【課題を解決するための手段】
【0019】
前記課題を解決するため、本発明の送信装置は、放送番組の映像音声ストリームを含む信号パケットを送信する送信装置であって、前記放送番組の構成の定義または/および放送に関連する付加データであるテキストベースのサービスメタデータを前記映像音声ストリームに多重化する多重化部、を備える。
【0020】
本発明のプログラムは、コンピュータを、前記送信装置として機能させるためのプログラムである。
【0021】
本発明の受信装置は、放送番組の映像音声ストリームを含む信号パケットを受信する受信装置であって、前記信号パケットから映像音声ストリームとテキストベースのサービスメタデータとを分離する分離部と、前記分離部が分離したテキストベースの前記サービスメタデータに応じて、前記映像音声ストリームを配信する配信部と、を備える。
【0022】
本発明のプログラムは、コンピュータを、前記受信装置として機能させるためのプログラムである。
【発明の効果】
【0023】
本発明によれば、放送波を送信する送信装置とそのプログラム、放送波を受信する受信装置とそのプログラムに、インターネットでよく利用されているテキスト形式のメッセージやファイルを含めて処理させることが可能となる。
【図面の簡単な説明】
【0024】
【
図2】サービスとテキストベース信号の例を示す図である。
【
図3】テキストベース信号の放送信号への多重を示す図である。
【
図4】テキストベース信号のデータ構造を示す図である。
【
図5】テキストベース信号のデータ構造を示す図である。
【
図6】生成部のマニフェストファイル生成処理を示すフローチャートである。
【
図7】受信処理部のマニフェストファイル解析処理を示すフローチャートである。
【
図8】MPEG-DASHのマニフェストファイルの例を示す図である。
【
図9】テキストベース信号の圧縮タイプIDとその意味とを示す図である。
【
図10】テキストベース信号のデータ構造を示す図である。
【
図11】本実施形態のMMTにおけるパッケージとテキストベース信号を示す図である。
【
図12】テキストベース信号のMMT-SIへの多重を示す図である。
【
図13】地上放送高度化の送受信システムを示す図である。
【
図14】比較例のMMTのPackage構造(メディアの構成)を示す図である。
【
図15】MMTPによるMMT-SIの多重を示す図である。
【発明を実施するための形態】
【0025】
以降、本発明を実施するための形態を、各図を参照して詳細に説明する。
【0026】
図1を参照して、本実施形態の送信装置11と受信装置21の構成と動作を説明する。
ここでは、MPEG-DASHエンコーダ12の出力データを配信する送信装置、並びに、その出力データを受信する受信装置21およびMPEG-DASHプレイヤ22Aを含むシステムを説明する。この送信装置11は、放送番組の映像音声ストリームを含む信号パケットを送信する。そして受信装置21は、放送番組の映像音声ストリームを含む信号パケットを受信する。送信装置11から受信装置21に配信する経路は、放送波と通信回線のうち何れであってもよい。
【0027】
MPEG-DASHはネット配信で用いられている配信方式であり、マニフェストファイルが規定されている。MPEG-DASHエンコーダ12は、映像/音声ストリームと共に、マニフェストファイルを出力する。マニフェストファイルを出力するのは、生成部121である。
送信装置11は、放送番組の映像/音声ストリームにマニフェストファイルを多重化して配信する。受信装置21は、配信された映像/音声ストリームとマニフェストファイルとを受信して記憶部213に格納する。
MPEG-DASHプレイヤ22Aは、受信装置21の記憶部213に格納されたマニフェストファイルを読み込んで、その中身を解析処理して映像/音声ストリームを再生する。
【0028】
マニフェストファイルには、受信装置21の配信サーバ214において、配信される際のURI(Uniform Resource Identifier)が割り当てられる。多重化部は、メッセージ(textbased_signaling_message)を多重化する際に、マニフェストファイルのURIをtextbased_signaling_URIに書き込む。
【0029】
送信装置11は、送出・配信部111を備える。送出・配信部111は、圧縮部113と多重化部112とを備える。この送信装置11はコンピュータであり、不図示のプログラムを実行することにより、送出・配信部111を具現化する。
【0030】
送出・配信部111は、MPEG-DASHエンコーダ12が出力したマニフェストファイルを圧縮して、映像/音声ストリームと多重化し、放送波や通信回線を介して受信装置21に配信する。マニフェストファイルは、映像コンテンツを構成する映像や音声のデータの構成情報や再生制御に必要なメタデータを保持するものである。映像や音声のデータの構成情報には、そのデータを格納するフラグメントファイルに付与されるファイル名の規則を含む。
【0031】
ここで圧縮部113は、マニフェストファイルを圧縮する。多重化部112は、圧縮されたマニフェストファイルと映像/音声ストリームとを多重化して放送波や通信回線を介して配信する。つまり多重化部112は、放送番組の構成の定義または/および放送に関連する付加データであるテキストベースのサービスメタデータを映像音声ストリームに多重化する。
【0032】
送出・配信部111は更に、番組表生成部13から、その他情報として番組情報を取得すると、多重化部112によって多重化し、放送波や通信回線を介して受信装置21に配信する。つまり信号パケットは、番組表の表示アプリケーションの構成ファイルを更に含んでいる。
【0033】
MPEG-DASHエンコーダ12は、映像/音声データをMPEG-DASH形式の映像/音声ストリームにエンコードし、そのマニフェストファイルを出力するものである。MPEG-DASHエンコーダ12は、MPEG-DASH形式の映像/音声ストリームのマニフェストファイルを生成する生成部121を備える。そして番組表生成部13は、番組情報を生成する。
【0034】
受信装置21は、多重分離部211と、記憶部213と、配信サーバ214とを備える。受信装置21は、放送コンテンツをHTTPなどの通信規格で配信可能な形式に変換するゲートウェイとして機能する。この送信装置11は、記憶部213を備えるコンピュータであり、不図示のプログラムを実行することにより、多重分離部211と配信サーバ214を具現化する。なお受信装置21は、通信回線を介して放送コンテンツを受信したのち、HTTPなどの通信規格で配信可能な形式に変換してもよい。
【0035】
多重分離部211は、放送波を介して配信された情報(信号パケット)からマニフェストファイルとMPEG-DASH形式の映像/音声ストリームとその他情報とを分離する。ここでマニフェストファイルは、テキストベースのサービスメタデータである。
多重分離部211は、パケットフィルタ部215と圧縮展開部216とを備える。パケットフィルタ部215は、放送波を介して配信された情報から、圧縮されたマニフェストファイルとMPEG-DASH形式の映像/音声ストリームとその他情報とを分離する。圧縮展開部216は、圧縮されたマニフェストファイルを展開する。ここでマニフェストファイルはサービスメタデータに相当する。つまり圧縮展開部216は、圧縮されているテキストベースのサービスメタデータの圧縮を展開する。
なお多重分離部211は、通信回線を介して配信された情報からマニフェストファイルとMPEG-DASH形式の映像/音声ストリームとその他情報とを分離してもよい。
【0036】
記憶部213は、マニフェストファイルとMPEG-DASH形式の映像/音声ストリームとその他情報とを記憶する。受信装置21は、放送信号を受信後、マニフェストファイルにtextbased_signaling_URIを割り当てて配信サーバ214で配信する。そして配信サーバ214は、マニフェストファイルとMPEG-DASH形式の映像/音声ストリームとその他情報とを、HTTPなどの通信規格で配信可能な形式に変換する。
【0037】
MPEG-DASH形式の映像/音声データには、受信装置21の配信サーバ214にて配信される際のURL(Uniform Resource Locator)が割り当てられる。この際のURLを映像/音声データ用URLと呼ぶ。MPEG-DASHのマニフェストには、映像/音声データ用のURLを記述する項目が規定されている。上記の映像/音声データ用URLは、生成部121により、マニフェストファイルに書き込まれている。そして、その他情報には、電子番組表などのアプリケーションの構成ファイルを更に含んでいる。
【0038】
受信装置21は、放送信号を受信後、映像/音声データに映像/音声データ用URLを割り当てて配信サーバ214で配信する。MPEG-DASHプレイヤ22Aは、映像/音声データ用URLで配信サーバ214にアクセスして、この映像/音声データを取得して再生する。配信サーバ214は、テキストベースの前記サービスメタデータに応じて、映像音声ストリームを配信する配信部として機能する。
【0039】
MPEG-DASHプレイヤ22Aは、マニフェストファイルのtextbased_signaling_URIにより、配信サーバ214からマニフェストファイルを取得する。なお、MPEG-DASHプレイヤ22Aには、ユーザ入力などにより、予めマニフェストファイルのURLが設定されている。これによりMPEG-DASHプレイヤ22Aは、マニフェストファイルとMPEG-DASH形式の映像/音声ストリームの配信を受けて再生したり、ブラウザによって番組表を閲覧させることが可能となる。
【0040】
図2を参照して、本実施形態の効果について説明する。
本実施形態のサービス5は、スケジュールに従って送出される番組の連続であり、放送または通信の伝送の単位である。
サービス5は、アセット映像データ51と、アセット音声データ52と、これらのマニフェストファイル53と、アセットアプリケーションデータ54と、アプリケーション定義データ55とを備えている。これらサービス5は、サービス構成情報56によって規定される。サービス5の内容は、電子番組表57によって告知される。
【0041】
アセット映像データ51は、一連の映像コンテンツである映像データ511を含み、映像ストリームを構成する。アセット音声データ52は、一連の音声コンテンツである音声データ521を含み、音声ストリームを構成する。マニフェストファイル53は、テキストベース信号で構成されている。マニフェストファイル53は、これらアセット映像データ51とアセット音声データ52とを定義するサービスメタデータである。
【0042】
アプリケーション定義データ55は、テキストベース信号で構成され、アセットアプリケーションデータ54を定義するサービスメタデータである。アプリケーション定義データ55は、所定のアプリケーションに紐付けられている、サービス構成情報56と電子番組表57は、それぞれテキストベース信号で構成されている。
【0043】
テキストベース信号は、マニフェストファイル53と、アプリケーション定義データ55と、サービス構成情報56と、電子番組表57に含まれている。テキストベース信号は、バイナリ構造のサービスメタデータと比べて拡張性に富み、XMLやJSONといった形式の信号を多重化できる。
【0044】
テキストベース信号をサービスメタデータに含ませることにより、例えば、放送規格が確定したあとに、装置が参照していた外部規格において項目が追加されたとしても、標準化会議を通さなくても、この装置が試験的に項目を追加したテストを容易に行うことができる。テストとは、技術検証またはサービス検証である。これにより、MPEG-DASHやHLSに係るマニフェストファイル53を多重化できるようになる。マニフェストファイル53はMPEG-DASHやHLSに必ず必要なデータであり、送出側で多重化するか、受信側で生成する必要がある。
【0045】
一方で、これらのマニフェストファイル53は、低遅延やコンテンツ差し替えなどいくつかのユースケースがあり、各ユースケースに応じてマニフェストファイル53の内容が変わる。どのユースケースをどのタイミングで運用するかは放送事業者によって異なる。そのため、本実施形態では、マニフェストファイル53にテキストベース信号を含ませて、これを多重化可能としている。これにより、放送事業者の判断でマニフェストファイル53の運用を選択できる。
【0046】
また、コンテンツ差し替えを想定する場合、差し替えていい範囲は編成内容に依存するため、送出側で指定する必要がある。更に緊急時も考慮するとリアルタイムで放送事業者が指定できる必要がある。
【0047】
以上の理由からマニフェストファイル53を映像/音声ストリームに多重化する機能は、報道機関である放送事業者がMPEG-DASHおよびHLSを放送信号に多重化する際には、必須の機能といえる。
【0048】
図3を参照して、テキストベース信号6211の放送信号への多重化を説明する。放送信号パケット6は、ヘッダ61とサービスメタデータ62とを含んでいる。そして、サービスメタデータ62は、テキストベース信号6211を内包するメッセージ621を含んでいる。つまり、放送信号パケット6には、テキストベース信号6211が多重化されている。
【0049】
図4を参照して、テキストベース信号を内包するメッセージのデータ構造を説明する。
メッセージ(textbased_signaling_message)は、message_idと、versionと、lengthと、message_payloadとを含んで構成される。ここでメッセージは、
図3に示すメッセージ621に相当する。
【0050】
message_idは、16bitのフィールドであり、各メッセージを示す識別子が格納される。versionは、8bitのフィールドであり、各メッセージのバージョン番号が書き込まれる領域である。lengthは、32bitのフィールドであり、このフィールドの直後から、メッセージペイロードの最後までの大きさをバイト単位で示す。message_payloadは、メッセージペイロード本体である。
【0051】
このmessage_payloadは、service_id_lengthと、複数のservice_id_byteと、textbased_signaling_typeと、textbased_signaling_versionと、textbased_signaling_compressionと、textbased_signaling_URI_lengthと、複数のtextbased_signaling_URI_byteと、textbased_signaling_lengthと、複数のtextbased_signaling_byteを含んで構成される。
【0052】
service_id_lengthは、8bitのフィールドであり、service_id_byteの大きさをバイト単位で示す。複数のservice_id_byteは、サービスID本体である。
【0053】
textbased_signaling_typeは、16bitのフィールドであり、このメッセージに格納するテキストベース信号の種類を示す。textbased_signaling_versionは、8bitのフィールドであり、このメッセージに格納するテキストベース信号のバージョン番号を示す。textbased_signaling_compressionは、8bitのフィールドであり、このメッセージに格納するテキストベース信号の圧縮方式を示す。
【0054】
textbased_signaling_URI_lengthは、16bitのフィールドであり、このメッセージに格納するテキストベース信号のURIの大きさをバイト単位で示す。複数のtextbased_signaling_URI_byteは、8bitのフィールドであり、このメッセージに格納するテキストベース信号のURIを示す。
【0055】
textbased_signaling_lengthは、32bitのフィールドであり、このメッセージに格納するテキストベース信号の大きさをバイト単位で示す。複数のtextbased_signaling_byteは、8bitのフィールドであり、このメッセージに格納するテキストベーステーブル本体を示す。このテキストベーステーブル本体は、textbased_signaling_compressionに応じた方式で圧縮されている。ここでテキストベーステーブル本体は、
図3に示すテキストベース信号6211に相当する。
【0056】
図5を参照して、テキストベース信号を含むメッセージのデータ構造を説明する。
図5に示したメッセージは、
図4に示したメッセージとは異なり、service_idが16bitのフィールドである。それ以外の構成は、
図4に示したメッセージと同様である。
【0057】
図6のフローチャートを参照して、生成部121のマニフェストファイル生成処理を説明する。生成部121は、映像/音声データ用URLを確定させると(ステップS10)、この映像/音声データ用URLをマニフェストファイルに書き込む(ステップS11)。そして生成部121は、マニフェストファイルに、その他の情報を書き込み(ステップS12)、マニフェストファイルを生成すると(ステップS13)、送信装置11の圧縮部113に入力して(ステップS14)、
図6の処理を終了する。
【0058】
圧縮部113は、このマニフェストファイルを圧縮してメッセージに格納する。そして多重化部112は、メッセージと、映像/音声ストリームと、その他情報を多重化して受信装置21に配信する。そして受信装置21の多重分離部211は、
図7のフローチャートで示す処理を実行する。
【0059】
図7のフローチャートを参照して、多重分離部211が実行するマニフェストファイル解析処理を説明する。多重分離部211は、マニフェストファイルを多重化したメッセージ(textbased_signaling_message)を解析する(ステップS20)。そしてパケットフィルタ部215は、ステップS21~S22の処理と、ステップS23~S26の処理とを並列に実行する。
【0060】
ステップS21にて、パケットフィルタ部215は、メッセージ(textbased_signaling_message)からtextbased_signaling_URIを取得する。そして多重分離部211は、配信サーバに対してtextbased_signaling_URIでマニフェストファイルにアクセスできるよう設定する(ステップS22)。
【0061】
ステップS23にて、パケットフィルタ部215は、メッセージ(textbased_signaling_message)からマニフェストファイルを取得する。なお、マニフェストファイルは、textbased_signaling_byteを所定の圧縮方式で解凍することによって取得可能である。
【0062】
多重分離部211は、このマニフェストファイルを解析して(ステップS24)、映像/音声データ用URLを取得する(ステップS25)。そして、多重分離部211は、配信サーバ214に対して映像/音声データ用URLで映像/音声データにアクセスできるよう設定すると(ステップS26)、
図7の処理を終了する。
【0063】
図8を参照して、MPEG-DASHのマニフェストファイルに設定された映像/音声データ用URLを説明する。このマニフェストファイルはXML形式であり、<SegmentTemplate durationのノード内のmedia属性に対して、"$RepresentationID$/$RepresentationID$_$Number$.m4v"の映像/音声データ用URLが設定されている。
【0064】
図9を参照して、textbased_signaling_compressionに示される圧縮方式を説明する。この圧縮方式に従って、textbased_signaling_byteは圧縮される。
圧縮タイプIDが0x01のとき、zlib方式の圧縮を示している。zlib方式の圧縮は、RFC1950に定義されている。
【0065】
圧縮タイプIDが0x02のとき、gzip方式の圧縮を示している。gzip方式の圧縮は、RFC1952に定義されている。
圧縮タイプIDが0x03のとき、deflate方式の圧縮を示している。deflate方式の圧縮は、RFC1951に定義されている。
【0066】
圧縮タイプIDが0x04のとき、Brotil方式の圧縮を示している。Brotil方式の圧縮は、RFC7932に定義されている。
圧縮タイプIDが0x05のとき、CBOR(Concise Binary Object Representation)方式の圧縮を示している。CBOR方式の圧縮は、RFC8949に定義されている。
【0067】
圧縮タイプIDが0x06のとき、EXI方式の圧縮を示している。EXI方式の圧縮は、W3C 勧告 Efficient XML Interchange (EXI) Format 1.0に定義されている。
圧縮タイプIDが0xFFのとき、非圧縮を示している。
【0068】
図10を参照して、テキストベース信号を内包したメッセージ(textbased_signaling_message)のデータ構造を説明する。
メッセージ(textbased_signaling_message)は、message_idと、versionと、lengthと、message_payloadとを含んで構成される。
message_idは、16bitのフィールドであり、各メッセージを示す識別子が格納される。versionは、8bitのフィールドであり、各メッセージのバージョン番号が書き込まれる領域である。lengthは、32bitのフィールドであり、このフィールドの直後から、メッセージペイロードの最後までの大きさをバイト単位で示す。message_payloadは、メッセージペイロード本体である。
【0069】
このmessage_payloadは、
図4のservice_id_lengthと複数のservice_id_byteに代えて、MMT_package_id_lengthと複数のMMT_package_id_byteとを有している。それ以外の構成は、
図4のmessage_payloadと同様である。
【0070】
MMT_package_id_lengthは、8bitのフィールドであり、MMT_package_id_byteの大きさをバイト単位で示す。複数のMMT_package_id_byteは、MMTパッケージID本体である。
【0071】
図11を参照して、本実施形態のMMTにおけるパッケージ3Aと、それに含まれるテキストベース信号を説明する。
パッケージ3Aには、アセット映像データ31と、アセット音声データ32と、アセットアプリケーションデータ34とが含まれている。パッケージ3Aには更に、テキストベース信号であるマニフェストファイル33とXML-AIT(Application Information Table)データ35とが含まれており、MP(MMT Package)テーブル36Aによって規定される。更にパッケージ3Aを閲覧するため、テキストベース信号である電子番組表データ37が提供されている。このパッケージ3Aは、放送あるいは通信の伝送の単位である。
【0072】
マニフェストファイル33とXML-AITデータ35は、テキストベース信号で構成されるため、放送規格が確定したあとに参照していた外部規格において項目が追加されたとしても、送信装置や受信装置に対して試験的に項目を追加したテストを行うことができる。
【0073】
アセット映像データ31は、一連の映像コンテンツである複数のMPU311を含み、映像ストリームを構成する。映像信号の処理において、MPU311は処理の単位となる。同一のアセット映像データ31に属するMPU311には、同一のアセット識別子が付加され、更にMPU311ごとにシーケンス番号が付加されている。
【0074】
アセット音声データ32は、一連の音声コンテンツである複数のMPU321を含み、音声ストリームを構成する。音声信号の処理において、MPU321は処理の単位となる。同一のアセット音声データ32に属するMPU321には、同一のアセット識別子が付加され、更にMPU321ごとにシーケンス番号が付加されている。
【0075】
アセットアプリケーションデータ34は、複数のMPU341を含み、アプリケーションの動作を規定する。
【0076】
図12を参照して、MMT-SIへのテキストベース信号の多重化を説明する。MMTPパケット4Aは放送信号であり、MMTPヘッダ41と、MMTPペイロード42と、複数のMMT-SI43Aを含んでいる。
MMTPヘッダ41には、このMMTPパケット4やMMTPペイロード42を規定する情報が含まれている。
MMTPペイロード42には、映像データまたは/および音声データが格納されている。1つのMMTPペイロード42は、1つのMMTPパケットに格納される。1つのMMTPペイロード42が、複数のMMTPパケットに格納されることはない。1つのMMTPパケットが複数のMMTPペイロード42を格納することはない。
【0077】
このMMT-SI43Aは、メッセージ431Aを含んでいる。メッセージ431Aは更に、テキストベース信号4311Aを含んでいる。そして
図4などで示したように、テキストベース信号4311Aは、放送規格が確定したあとに可変可能なテキストデータである。
【0078】
《発明の効果》
本実施形態のテキストベース信号によれば、バイナリ構造のサービスメタデータと比べ、拡張性に富むXMLやJSONといった形式の信号を容易に多重化できるようになる。例えば、放送規格が確定したあとに参照していた外部規格において項目が追加されたとしても、標準化会議を通さなくても、送信装置と受信装置は無変更のままで、エンコーダやプレイヤに試験的に項目を追加したテストを行うことができ、技術検証およびサービス検証を容易に行うことができる。
【0079】
本実施形態のテキストベース信号によれば、MPEG-DASHやHLSのマニフェストファイルなどのサービスメタデータを多重化できるようになる。マニフェストファイルはMPEG-DASHやHLSに必ず必要なデータであり、送信装置側で多重化するか、受信装置側で生成する必要がある。一方で、これらのマニフェストファイルは、低遅延やコンテンツ差し替えなどいくつかのユースケースがあり、ユースケースによってマニフェストファイルの内容が変わる。どのユースケースをどのタイミングで運用するかは放送事業者によって異なる。そのため、多重化可能にすることで放送事業者の判断で運用を選択できることにつながる。
【0080】
また、コンテンツ差し替えを想定する場合は、差し替えていい範囲は編成内容に依存するため、送出側で指定する必要がある。更に緊急時も考慮するとリアルタイムで放送事業者が指定できる必要がある。
【0081】
以上の理由からマニフェストファイルを多重化する機能は報道機関である放送事業者がMPEG-DASH、HLSを放送信号に多重化する際には、必須の機能といえる。
【0082】
以上、実施形態を詳述してきたが、本発明は前記した実施形態に限られるものではなく、本発明の要旨を逸脱しない範囲の設計変更等も含まれる。
【0083】
前記した実施形態では、送信装置と受信装置が独立したハードウェアであることとして説明したが、本発明は、これに限定されない。例えば、本発明は、コンピュータが備えるCPU、メモリ、ハードディスク等のハードウェア資源を、前記した送信装置と受信装置として機能させるためのプログラムで実現することもできる。このプログラムは、通信回線を介して配布してもよく、CD-ROMやフラッシュメモリ等の記録媒体に書き込んで配布してもよい。
【符号の説明】
【0084】
1 送信システム
11 送信装置
111 送出・配信部
112 多重化部
113 圧縮部
12 MPEG-DASHエンコーダ
121 生成部
13 番組表生成部
2 受信システム
21 受信装置
211 多重分離部 (分離部)
212 HTTPクライアント
213 記憶部
2131 マニフェストファイル
2132 セグメントファイル
214 配信サーバ
215 パケットフィルタ部
216 圧縮展開部
22A MPEG-DASHプレイヤ
22 提示部
221 Webブラウザ
3,3A パッケージ
31 アセット映像データ
311 MPU
32 アセット音声データ
321 MPU
33 マニフェストファイル
34 アセットアプリケーションデータ
341 MPU
35 XML-AITデータ
36,36A MPテーブル
37 電子番組表データ
4,4A MMTPパケット
41 MMTPヘッダ
42 MMTPペイロード
43 MMT-SI
43A MMT-SI
431A メッセージ
4311A テキストベース信号
5 サービス
51 アセット映像データ
511 映像データ
52 アセット音声データ
521 音声データ
53 マニフェストファイル
54 アセットアプリケーションデータ
55 アプリケーション定義データ
56 サービス構成情報
57 電子番組表
6 放送信号パケット
61 ヘッダ
62 サービスメタデータ
621 メッセージ
6211 テキストベース信号