(58)【調査した分野】(Int.Cl.,DB名)
UHDTV用の映像信号及び所定チャンネル数の音声信号を入力し、前記映像信号のソースイメージを分割して複数のサブイメージを生成し、前記サブイメージ毎に、当該サブイメージを分割して複数のベーシックイメージを生成し、前記ベーシックイメージ毎に、当該ベーシックイメージから画素のラインデータを順次取り出して対応する系統のベーシックストリームを生成し、複数系統の前記ベーシックストリームを合成してリンク信号を生成し、前記映像信号と音声信号とを多重した前記リンク信号を含む複数のリンク信号を送信する映像音声信号送信装置において、
前記音声信号からチャンネル毎の音声データを抽出し、前記音声データを含む音声データパケットであることを示す識別データ及び前記抽出した音声データを、前記音声データパケットの所定領域にそれぞれ格納し、前記音声データパケットを生成する音声データパケット生成部と、
前記音声信号から、チャンネル毎の音声データに含まれるチャンネルに関する情報を抽出し、前記チャンネルに関する情報に基づいて音声制御データを生成し、前記音声制御データを含む音声制御パケットであることを示す識別データ及び前記生成した音声制御データを、前記音声制御パケットの所定領域にそれぞれ格納し、前記音声制御パケットを生成する音声制御パケット生成部と、
前記ベーシックイメージ毎に、当該ベーシックイメージから画素のラインデータを順次取り出し、当該ベーシックイメージに対応する各系統のベーシックストリームを生成する際に、前記音声データパケット生成部により生成された音声データパケットを、1つのリンク信号に合成される第1系統の前記ベーシックストリームの補助データ領域に格納し、前記音声制御パケット生成部により生成された音声制御パケットを、前記音声データパケットを格納した前記第1系統とは異なる系統であって、前記1つのリンク信号に合成される第2系統の前記ベーシックストリームの補助データ領域に格納するベーシックストリーム生成部と、
前記ベーシックストリーム生成部により生成された各系統のベーシックストリームについて、複数系統毎に前記ベーシックストリームを合成し、前記複数のリンク信号を生成する際に、前記音声データパケットが格納された前記第1系統の前記ベーシックストリーム及び前記音声制御パケットが格納された前記第2系統の前記ベーシックストリームを含む複数系統の前記ベーシックストリームを合成し、前記複数のリンク信号のうちの前記1つのリンク信号を生成するリンク信号生成部と、を備えたことを特徴とする映像音声信号送信装置。
UHDTV用の映像信号及び所定チャンネル数の音声信号を入力し、前記映像信号のソースイメージを分割して複数のサブイメージを生成し、前記サブイメージ毎に、当該サブイメージを分割して複数のベーシックイメージを生成し、前記ベーシックイメージ毎に、当該ベーシックイメージから画素のラインデータを順次取り出して対応する系統のベーシックストリームを生成し、複数系統の前記ベーシックストリームを合成してリンク信号を生成し、前記映像信号と音声信号とを多重した前記リンク信号を含む複数のリンク信号を送信する映像音声信号送信方法において、
前記音声信号からチャンネル毎の音声データを抽出する第1のステップと、
前記音声データを含む音声データパケットであることを示す識別データ及び前記抽出した音声データを、前記音声データパケットの所定領域にそれぞれ格納し、前記音声データパケットを生成する第2のステップと、
前記音声信号から、チャンネル毎の音声データに含まれるチャンネルに関する情報を抽出する第3のステップと、
前記チャンネルに関する情報に基づいて、音声制御データを生成する第4のステップと、
前記音声制御データを含む音声制御パケットであることを示す識別データ及び前記生成した音声制御データを、前記音声制御パケットの所定領域にそれぞれ格納し、前記音声制御パケットを生成する第5のステップと、
前記ベーシックイメージ毎に、当該ベーシックイメージから画素のラインデータを順次取り出し、当該ベーシックイメージに対応する各系統のベーシックストリームを生成する際に、前記音声データパケットを、1つのリンク信号に合成される第1系統の前記ベーシックストリームの補助データ領域に格納し、前記音声制御パケットを、前記音声データパケットを格納した前記第1系統とは異なる系統であって、前記1つのリンク信号に合成される第2系統の前記ベーシックストリームの補助データ領域に格納する第6のステップと、
各系統のベーシックストリームについて、複数系統毎に前記ベーシックストリームを合成し、前記複数のリンク信号を生成する際に、前記音声データパケットが格納された前記第1系統の前記ベーシックストリーム及び前記音声制御パケットが格納された前記第2系統の前記ベーシックストリームを含む複数系統の前記ベーシックストリームを合成し、前記複数のリンク信号のうちの前記1つのリンク信号を生成する第7のステップと、
を有することを特徴とする映像音声信号送信方法。
【発明を実施するための形態】
【0021】
以下、本発明を実施するための形態について図面を用いて詳細に説明する。本発明は、UHDTV用のインタフェースを用いて映像音声信号を伝送する際に、映像信号の基本ストリーム(ベーシックストリーム)の補助データ領域(ANC領域)に、音声信号を多重することを特徴とする。
【0022】
本発明の実施形態では、次の仕様の音声信号をUHDTV用の映像信号に多重する例を挙げて説明する。
(1)サンプリング周波数:48kHz、96kHz
(2)量子化ビット数:16、20、24ビット
(3)チャンネル数:32チャンネル
(4)音声信号:AES信号
ここで、チャンネル数が24チャンネル(22.2チャンネル分)ではなく32チャンネルとしたのは、32チャンネルにてスタジオ音声の主要な形式(22.2Ch,5.1Ch,2Ch)を同時に伝送することができる等、拡張性を考慮したためである。
【0023】
すなわち、本発明の実施形態は、UHDTV用のインタフェースの規格(非特許文献1:ARIB標準規格STD−B58)に規定された補助データ領域に、UHDTV用の3次元マルチチャンネル音響方式スタジオ規格(非特許文献2:ARIB標準規格STD−B59)に規定された音声信号を格納することで、UHDTV用の映像信号及び音声信号を多重して伝送する例である。
【0024】
〔伝送システム〕
まず、本発明の実施形態による映像音声信号送信装置及び映像音声信号受信装置を含む伝送システムについて説明する。
図1は、伝送システムの概略構成を示すブロック図である。この伝送システムは、UHDTV用のインタフェースを用いて映像音声信号を伝送する映像音声信号送信装置1及び映像音声信号受信装置2を備えて構成される。映像音声信号送信装置1と映像音声信号受信装置2とは、1本のケーブルの伝送路3を介して接続される。
【0025】
映像音声信号送信装置1は、例えば、カメラ等からの映像信号(UHDTV用の映像信号)を入力すると共に、マイク等からの音声信号(UHDTV用の音声信号)を入力し、映像信号及び音声信号を多重してリンク信号を生成し、リンク信号を、伝送路3を介して映像音声信号受信装置2へ送信する。
【0026】
映像音声信号受信装置2は、映像音声信号送信装置1から伝送路3を介して送信されたリンク信号を受信し、リンク信号から映像信号及び音声信号を復元する。そして、映像音声信号受信装置2は、例えば、映像信号をディスプレイ等に出力すると共に、音声信号をスピーカ等に出力する。
【0027】
〔映像音声信号送信装置〕
次に、
図1に示した映像音声信号送信装置1について詳細に説明する。
図2は、映像音声信号送信装置1の構成を示すブロック図である。この映像音声信号送信装置1は、サブイメージ生成部11、基本イメージ(ベーシックイメージ)生成部12、基本ストリーム(ベーシックストリーム)生成部13、リンク信号生成部14、音声データパケット生成部15及び音声制御パケット生成部16を備えている。
【0028】
映像音声信号送信装置1のサブイメージ生成部11は、UHDTV用の映像信号である1以上の色信号コンポーネントからなる動画像の映像信号を入力し、映像信号を構成する色信号コンポーネント毎に、1フレームのソースイメージを分割して複数のサブイメージを生成する。そして、サブイメージ生成部11は、色信号コンポーネント毎に生成した複数のサブイメージを基本イメージ生成部12に出力する。
【0029】
基本イメージ生成部12は、サブイメージ生成部11により生成された色信号コンポーネント毎の複数のサブイメージを入力し、サブイメージ毎に、当該サブイメージを分割して複数の基本イメージを生成する。そして、基本イメージ生成部12は、生成した複数の基本イメージを基本ストリーム生成部13に出力する。
【0030】
音声データパケット生成部15は、UHDTV用の非圧縮の音声信号を入力し、音声信号を構成する1サンプル毎の音声データを抽出し、1サンプル毎の音声データを所定領域に格納して音声データパケットを生成し、生成した音声データパケットを基本ストリーム生成部13に出力する。音声データパケット生成部15の詳細については後述する。
【0031】
音声制御パケット生成部16は、UHDTV用の非圧縮の音声信号を入力し、音声信号を構成する1サンプル毎の音声データに含まれるC(チャンネルステータスビット)を抽出し、所定数のC(チャンネルステータスビット)に基づいて音声制御データを生成する。そして、音声制御パケット生成部16は、音声制御データを所定領域に格納して音声制御パケットを生成し、生成した音声制御パケットを基本ストリーム生成部13に出力する。音声制御パケット生成部16の詳細については後述する。
【0032】
基本ストリーム生成部13は、基本イメージ生成部12により生成された基本イメージを入力すると共に、音声データパケット生成部15から音声データパケットを、音声制御パケット生成部16から音声制御パケットをそれぞれ入力する。そして、基本ストリーム生成部13は、基本イメージから画素のラインデータを順次取り出し、取り出した画素のラインデータを、基本ストリームの有効映像領域に格納すると共に、音声データパケット及び音声制御パケットを、基本ストリームの補助データ領域に格納する。
【0033】
また、基本ストリーム生成部13は、所定の制御データ(同期信号、ライン番号等)を所定領域に格納し、基本ストリームを生成する。そして、基本ストリーム生成部13は、生成した基本ストリームをリンク信号生成部14に出力する。基本ストリーム生成部13の詳細については後述する。
【0034】
リンク信号生成部14は、基本ストリーム生成部13により生成された基本ストリームを入力し、複数の基本ストリームに対して多重化処理(合成処理)等を施し、所定伝送速度のリンク信号を生成する。そして、リンク信号生成部14は、生成したリンク信号を映像音声信号受信装置2へ送信する。
【0035】
このように、映像音声信号送信装置1は、基本ストリーム生成部13において映像信号と音声信号とを多重した基本ストリームを生成し、所定伝送速度のリンク信号をシリアルデータストリームとして、1本のケーブルの伝送路3を介して映像音声信号受信装置2へ送信する。
【0036】
尚、サブイメージ生成部11、基本イメージ生成部12及びリンク信号生成部14の処理の詳細、並びに基本ストリーム生成部13における映像信号の処理の詳細については、映像信号のみを送受信する手法について記載された前述の特許文献1を参照されたい。
【0037】
(ソースイメージからリンク信号までのマッピング)
次に、映像音声信号送信装置1が映像信号のソースイメージを入力してからリンク信号を生成するまでの間のマッピング手順について説明する。
図3は、映像信号のフレーム周波数が60Hzの場合のマッピング手順について説明する図であり、
図4は、映像信号のフレーム周波数が120Hzの場合を説明する図であり、
図5は、映像信号のフレーム周波数が30Hzの場合を説明する図である。
【0038】
図3〜
図5は、映像信号を構成する色信号コンポーネントC1,C2,C3において、その1フレームのソースイメージは、8k×4kの画素からなり、それぞれ60Hz,120Hz,30Hzのフレーム周波数で動作する場合を示している。
【0039】
ソースイメージからN個のサブイメージが、サブイメージ生成部11により生成される。このサブイメージは、4k×2kの画素からなり、それぞれ60Hz,120Hz,30Hzのフレーム周波数で動作する。
【0040】
サブイメージからそれぞれ4個(
図3〜
図5)の基本イメージが、基本イメージ生成部12により生成される。したがって、基本イメージ生成部12により、それぞれ4N個の基本イメージが生成される。この基本イメージは、2k×1kの画素からなり、それぞれ60Hz,120Hz,30Hzのフレーム周波数で動作する。
【0041】
基本イメージから当該基本イメージに対応する基本ストリームが、基本ストリーム生成部13により生成される。したがって、基本ストリーム生成部13により、それぞれ4N個の基本ストリームが生成され、それぞれ4N系統の基本ストリームが存在することになる。本発明の実施形態では、音声信号は、基本ストリームが生成される際に、映像信号と多重される。
【0042】
図3では、4個(4系統)の基本ストリームから1本のリンク信号が、リンク信号生成部14により生成され、
図4では、2個(2系統)の基本ストリームから1本のリンク信号が生成され、
図5では、8個(8系統)の基本ストリームから1本のリンク信号が生成される。したがって、リンク信号生成部14により、N本、2N本またはN/2本のリンク信号が生成される。このリンク信号は、10.692Gbit/sの速度にて伝送される。
【0043】
〔音声データパケット生成部〕
次に、
図2に示した音声データパケット生成部15について詳細に説明する。
図6は、補助データパケットの構成を示す図である。音声データパケットは、この補助データパケットの構成に従って生成される。後述する音声制御パケットも同様である。
【0044】
尚、
図6に示す補助データパケットは、後述する
図10及び
図11に示す基本ストリームの補助データ領域に挿入することができるパケットとして規定されている(非特許文献1:ARIB標準規格STD−B58
図4−3)。
【0045】
補助データパケットは、ADF(補助データフラグ)、DID(データ識別ワード)、DBN(データブロック番号ワード)またはSDID(第2データ識別ワード)、DC(データカウントワード)、UDW(ユーザデータワード)及びCS(チェックサム)の各領域のデータにより構成される。
【0046】
ADF領域には、補助データパケットの先頭を示す固定のデータが格納される。DID領域には、パケットの種類を示す識別情報が格納される。音声データパケットの場合、当該パケットであることを示す識別情報が格納され、後述する音声制御パケットの場合、当該パケットであることを示す識別情報が格納される。また、UDW領域には、音声データパケットの場合、音声データ等が格納され、音声制御パケットの場合、音声制御データ等が格納される。
【0047】
HD−SDIは10ビット/ワードで規定されるインタフェースであり、HD−SDIに多重される補助データパケットも10ビット/ワードを前提とした構造となっている。一方、UHDTV用のインタフェースは、12ビット/ワードのインタフェースである。
【0048】
そこで、音声データパケット生成部15は、HD−SDI等の補助データパケットとの互換性を保つため、
図6に示すように、10ビット/ワードのデータを12ビット/ワードのデータに変換する。後述する音声制御パケット生成部16も同様である。
図6に示した補助データパケットにおいて、10ビット/ワードのデータを12ビット/ワードに変換する手法は既知であるから、ここでは説明を省略する。詳細は、非特許文献1:ARIB標準規格STD−B58を参照されたい。
【0049】
(音声サンプリング周波数が48kHzの場合)
図7は、音声サンプリング周波数が48kHzの場合における音声データパケット生成部15の処理を説明する図である。尚、
図7に示す音声信号、AESサブフレーム及び音声データパケットの関係は、既存の規格に規定されている(ARIB標準規格BTA S−006C 解説
図1)。
【0050】
音声データパケット生成部15は、AESチャンネルペア1,2の音声信号(AES音声)を入力し、音声信号から、AESサブフレームである各チャンネルの1サンプル音声データを抽出する。
【0051】
AESサブフレームは、
図7に示すように、プリアンブル、AUXデータまたは音声、音声、V(サンプルパリティビット)、U(ユーザビット)、C(チャンネルステータスビット)及びP(パリティビット)の各データにより構成される。プリアンブルには、AESサブフレームの開始点情報等が含まれている。プリアンブルがZの場合、192フレームで構成されるAESフレームの先頭を示しており、Xの場合、当該AESサブフレームがチャンネル1のAESサブフレームであることを示しており、Yの場合、当該AESサブフレームがチャンネル2のAESサブフレームであることを示している。
【0052】
V(サンプルパリティビット)は、音声サンプルの有効性を示す。U(ユーザビット)は、ユーザにより使用されるビットを示す。C(チャンネルステータスビット)は、チャンネルの関連情報を伝送するために用いられ、後述するように、192個のC(チャンネルステータスビット)に基づいて音声制御データが生成される。P(パリティビット)は、V(サンプルパリティビット)、U(ユーザビット)及びC(チャンネルステータスビット)に対する偶数パリティである。
【0053】
音声データパケット生成部15は、音声データパケットであることを示す識別情報を、音声データパケットのDID領域に格納する。
【0054】
音声データパケット生成部15は、音声信号から抽出した各チャンネルの1サンプル音声データを、4ワードのデータとして、音声データパケットのUDW領域に格納する。各チャンネルの1サンプル音声データ(AESサブフレーム)を4ワードのデータとしてUDW領域に格納する際の処理については後述する。
【0055】
音声データパケット生成部15は、CLK(音声クロック位相情報データ)及びECC(誤り訂正データ)を生成してUDW領域に格納する。CLK及びECCは、非特許文献6のARIB標準規格BTA S−006の規定に従うものとする。そして、音声データパケット生成部15は、所定データを、ADF、DBNまたはSDID、DC及びCSの各領域に格納する。
【0056】
このように、音声データパケット生成部15は、
図7の下段に示すとおり、UDW領域に、2ワードのCLK、4ワードからなる1サンプル音声データにつき1サンプル音声データを4チャンネル分(4チャンネル分の1サンプル音声データ、合計16ワード)、及び6ワードのECCを格納し、合計31ワードからなる音声データパケットを生成する。
【0057】
これにより、音声データパケット生成部15にて、
図6に示した補助データパケットと同じ構成の音声データパケットが音声信号から生成され、そのUDW領域には、4チャンネル分の1サンプル音声データ(合計4サンプル音声データ)が格納される。また、音声データパケットによって、AES音声のトランスペアレントな伝送が可能となる。
【0058】
(音声サンプリング周波数が96kHzの場合)
図8は、音声サンプリング周波数が96kHzの場合における音声データパケット生成部15の処理を説明する図である。尚、
図8に示す音声信号、AESサブフレーム及び音声データパケットの関係は、既存の規格に規定されている(SMPTE ST299−1
図2)。
【0059】
音声データパケット生成部15は、
図7と同様に、音声信号(AES音声)を入力し、音声データパケットであることを示す識別情報をDID領域に格納し、音声信号から、AESサブフレームである各チャンネルの1サンプル音声データを抽出し、UDW領域に格納する。また、音声データパケット生成部15は、所定データをADF領域等に格納する。
【0060】
このように、音声データパケット生成部15は、
図8に示すとおり、UDW領域に、2ワードのCLK、4ワードからなる1サンプル音声データにつき2サンプル音声データを2チャンネル分(2チャンネル分の2サンプル音声データ、合計16ワード)、及び6ワードのECCを格納し、合計31ワードからなる音声データパケットを生成する。
【0061】
これにより、音声データパケット生成部15にて、
図6に示した補助データパケットと同じ構成の音声データパケットが音声信号から生成され、そのUDW領域には、2チャンネル分の2サンプル音声データ(合計4サンプル音声データ)が格納される。また、音声データパケットによって、AES音声のトランスペアレントな伝送が可能となる。
【0062】
(AESサブフレームを4ワードデータとしてUDW領域に格納する処理)
図9は、32ビットのAESサブフレームを4ワードデータとして音声データパケットのUDW領域に格納する際の割り当てを説明する図である。
図9に示すAESサブフレームは、
図7及び
図8に示したAESサブフレームに相当する。
【0063】
音声データパケット生成部15は、
図9に示す割り当てに従って、音声信号から抽出した32ビットのAESサブフレームである1サンプル音声データを、4ワードデータとして音声データパケットのUDW領域に格納する。
【0064】
具体的には、音声データパケット生成部15は、音声信号から抽出したAESサブフレームである1サンプル音声データからプリアンブルのデータを抽出し、プリアンブルがZフラグであるか否かを判定する。音声データパケット生成部15は、プリアンブルがZフラグであると判定した場合、
図9に示すように、プリアンブルがZフラグであることを示す情報を、UDW領域の当該4ワードのうち1ワード目の第5ビットb5に格納する。これに対し、音声データパケット生成部15は、プリアンブルがZフラグでない(XフラグまたはYフラグ)と判定した場合、UDW領域の設定を行わない。これにより、AESサブフレームのプリアンブルのデータはそのまま伝送されず、Zフラグである場合にのみ、それを示す情報が伝送される。
【0065】
音声データパケット生成部15は、AESサブフレームである1サンプル音声データからAUXデータまたは音声のデータ、及び音声のデータを抽出し、
図9に示すように、これらのデータ(24ビットのデータ)を、UDW領域の当該4ワードのうち1ワード目の第6ビットb6〜第9ビットb9、2ワード目の第2ビットb2〜第9ビットb9、3ワード目の第2ビットb2〜第9ビットb9及び4ワード目の第2ビットb2〜第5ビットb5に格納する。尚、音声のデータが20ビットまたは16ビットの場合には、下位ビットに0を格納することにより、24ビットの場合と同様に扱う。
【0066】
音声データパケット生成部15は、AESサブフレームである1サンプル音声データからV,U,C,Pの各データを抽出し、
図9に示すように、これらのデータを、UDW領域の当該4ワードのうち4ワード目の第6ビットb6〜第9ビットb9に格納する。
【0067】
音声データパケット生成部15は、UDW領域の1〜4ワード目の第0ビットb0〜第9ビットb9における偶数パリティを、それぞれ第10ビットb10に格納し、1〜4ワード目の第10ビットb10の反転ビットを、それぞれ第11ビットb11に格納する。尚、その他のビットには0が格納される。
【0068】
〔音声制御パケット生成部〕
次に、
図2に示した音声制御パケット生成部16について詳細に説明する。音声制御パケット生成部16は、音声信号(AES音声)を入力し、音声信号から、AESサブフレームである各チャンネルの1サンプル音声データを抽出する。そして、音声制御パケット生成部16は、1サンプル音声データから、当該1サンプル音声データに含まれるC(チャンネルステータスビット)を抽出する。そして、音声制御パケット生成部16は、192個のAESサブフレーム毎に、192個のC(チャンネルステータスビット)に基づいて、音声サンプリング周波数、チャンネルの有効性、音声遅延情報等の所定の音声制御データを生成する。
【0069】
音声制御パケット生成部16は、音声制御パケットであることを示す識別情報を、音声制御パケットのDID領域に格納する。
【0070】
音声制御パケット生成部16は、生成した音声制御データを、音声制御パケットのUDW領域に格納する。そして、音声制御パケット生成部16は、所定データを、ADF、DBNまたはSDID、DC及びCSの各領域に格納する。
【0071】
これにより、音声制御パケット生成部16にて、
図6に示した補助データパケットと同じ構成の音声制御パケットが音声信号から生成され、そのUDW領域には、音声制御データが格納される。
【0072】
〔基本ストリーム生成部〕
次に、
図2に示した基本ストリーム生成部13について詳細に説明する。前述のとおり、基本ストリーム生成部13は、基本イメージから画素のラインデータを順次取り出し、取り出した画素のラインデータを、基本ストリームの有効映像領域に格納すると共に、音声データパケット及び音声制御パケットを、基本ストリームの補助データ領域に格納し、所定の制御データを所定領域に格納することで、映像信号及び音声信号を多重して基本ストリームを生成する。
【0073】
図10は、基本ストリームのフレーム構造を示す図であり、
図11は、基本ストリームのライン構造を示す図である。尚、
図10及び
図11に示す基本ストリームのフレーム構造及びライン構造は、既存の規格に規定されている(非特許文献1:ARIB標準規格STD−B58
図4−2、
図4−1)。
【0074】
図10に示す基本ストリームのフレームは、
図11に示す基本ストリームのラインを複数(1125ライン(ライン番号1〜1125))組み合わせることにより構成される。映像信号は、ベーシックイメージから取り出された画素のラインデータとして、有効映像領域(有効ライン)に格納され、音声信号は、音声データパケット及び音声制御パケットとして、補助データが格納される領域(補助データ領域)に格納される。EAV等の制御データは既知であるから、ここでは説明を省略する。
【0075】
ここで、音声信号から生成された音声データパケット及び音声制御パケットは、
図3〜
図5に示した複数系統の基本ストリームのうち、異なる系統の基本ストリームの補助データ領域に格納される。例えば、音声データパケットは、第1の系統における基本ストリームの補助データ領域に格納され、音声制御パケットは、第2の系統における基本ストリームの補助データ領域に格納される。
【0076】
図12は、基本ストリーム生成部13の処理を示すフローチャートである。まず、基本ストリーム生成部13は、基本イメージ生成部12から系統毎の基本イメージを入力すると共に(ステップS1201)、音声データパケット生成部15から音声データパケットを、音声制御パケット生成部16から音声制御パケットをそれぞれ入力する(ステップS1202)。
【0077】
基本ストリーム生成部13は、系統毎に、基本イメージから画素のラインデータを取り出し、基本ストリームのライン構造の有効ライン(有効映像領域)に格納する(ステップS1203)。基本ストリーム生成部13は、この処理をラインデータ毎に行う。これにより、基本イメージの全ての画素は、基本ストリームのフレーム構造の有効映像領域に格納される。
【0078】
基本ストリーム生成部13は、音声データパケット生成部15から入力した8個の音声データパケットを結合する(ステップS1204)。そして、基本ストリーム生成部13は、第1の系統または複数の系統において、結合した8個の音声データパケットを、基本ストリームのライン構造の補助データ領域に格納する(ステップS1205)。
【0079】
図7及び
図8に示したとおり、音声データパケットは31ワードからなる。一方、
図11に示したとおり、基本ストリームの1ラインあたりの補助データ領域は268ワード存在する。したがって、基本ストリームの1ラインあたり、最大8個の音声データパケット(31×8=248ワード<268ワード)を格納することができる。
【0080】
ここで、音声サンプリング周波数が48kHzの場合、
図7にて説明したとおり、1個の音声データパケットには、4チャンネル分の1サンプル音声データが格納される。したがって、8個の音声データパケットには、32チャンネル分の1サンプル音声データが格納される。つまり、基本ストリームの1ライン分の補助データ領域には、32チャンネル分の1サンプル音声データが格納される。
【0081】
また、音声のサンプリング周波数が96kHzの場合、
図8にて説明したとおり、1個の音声データパケットには、2チャンネル分の2サンプル音声データが格納される。したがって、8個の音声データパケットには、16チャンネル分の2サンプル音声データが格納される。つまり、基本ストリームの1ライン分の補助データ領域には、16チャンネル分の2サンプル音声データが格納される。
【0082】
図12に戻って、基本ストリーム生成部13は、この処理を所定ライン数分行う。これにより、32チャンネルの音声信号から生成された音声データパケットは、第1の系統または複数の系統における基本ストリームの1フレーム分の補助データ領域に格納される。すなわち、第1の系統または複数の系統における基本ストリームの1フレーム分の補助データ領域を用いて、32チャンネル分の音声信号を伝送することができる。詳細については後述する。
【0083】
基本ストリーム生成部13は、音声データパケットを格納した系統とは異なる系統において、音声制御パケットを、基本ストリームのライン構造の補助データ領域に格納する(ステップS1206)。これにより、例えば32チャンネルの音声信号から生成された音声制御パケットは、音声データパケットを格納した系統とは異なる系統(第2の系統または複数の系統)において、基本ストリームのフレーム構造のうち1ラインの補助データ領域に格納される。
【0084】
基本ストリーム生成部13は、系統毎に、EAV等の制御データを所定領域に格納し(ステップS1207)、基本ストリームを生成する(ステップS1208)。そして、基本ストリーム生成部13は、系統毎に生成した基本ストリームをリンク信号生成部14に出力する(ステップS1209)。
【0085】
(1−1:音声サンプリング周波数48kHz、映像フレーム周波数60Hzの場合)
次に、音声サンプリング周波数が48kHz及び映像フレーム周波数が60Hzの場合の処理について説明する。この場合、基本ストリーム生成部13は、映像1フレームあたり、800サンプル(=48kHz/60Hz)の音声データを多重する必要がある。
【0086】
図13は、音声サンプリング周波数が48kHz及び映像フレーム周波数が60Hzの場合の処理について説明する図である。前述のとおり、音声のサンプリング周波数が48kHzの場合、1個の音声データパケットには4チャンネル分の1サンプル音声データが格納され、基本ストリームの1ラインには8個の音声データパケットが格納される。つまり、基本ストリームの1ラインの補助データ領域を用いて、32チャンネル分の1サンプル音声データを伝送することができる。
【0087】
図10に示したとおり、映像1フレーム(基本ストリームの1フレーム)は、1125本のラインにより構成される。基本ストリームの1フレームの補助データ領域は、最大1125サンプル分の音声データ(32チャンネル分の1125サンプル音声データ)を多重可能な容量を有するから、基本ストリーム生成部13は、32チャンネル分の800サンプル音声データを多重することができる。
【0088】
これにより、基本ストリームの1フレームの補助データ領域を用いて、32チャンネル分の800サンプル音声データを伝送することができる。つまり、映像フレーム周波数が60Hzの場合、映像音声信号送信装置1は、1系統の基本ストリームを用いて、サンプリング周波数48kHzの音声データを32チャンネル分伝送することができる。
【0089】
図3に示したとおり、映像フレーム周波数が60Hzの場合、1本のリンク信号は、4個の基本ストリームを多重して生成される。これにより、映像音声信号送信装置1は、1本のリンク信号を構成する4個の基本ストリームのうち、任意の1個の基本ストリームの補助データ領域を用いて、サンプリング周波数48kHzの音声データを32チャンネル分伝送することができる。
【0090】
また、基本ストリーム生成部13は、他の3個の基本ストリームのうち、任意の1個の基本ストリームの補助データ領域に、音声制御パケットを格納する。これにより、映像音声信号送信装置1は、N本のリンク信号のうち、1本のリンク信号のみを用いて、サンプリング周波数48kHzの32チャンネル分の音声データを含む音声データパケットと、音声制御パケットとを伝送することができる。
【0091】
尚、映像フレーム周波数が59.94Hz、50Hzの場合も同様である。映像フレーム周波数が59.94Hzの場合は、映像5フレーム分の時間で4004サンプル分の音声データを伝送すればよく、映像フレーム周波数が50Hzの場合は、映像1フレーム分の時間で960サンプル分の音声データを伝送すればよい。
【0092】
(1−2:音声サンプリング周波数48kHz、映像フレーム周波数120Hzの場合)
次に、音声サンプリング周波数が48kHz及び映像フレーム周波数が120Hzの場合の処理について説明する。この場合、基本ストリーム生成部13は、映像1フレームあたり、400サンプル(=48kHz/120Hz)の音声データを多重する必要がある。
【0093】
図14は、音声サンプリング周波数が48kHz及び映像フレーム周波数が120Hzの場合の処理について説明する図である。前述のとおり、音声のサンプリング周波数が48kHzの場合、基本ストリームの1ラインの補助データ領域を用いて、32チャンネル分の1サンプル音声データを伝送することができる。
【0094】
図10に示したとおり、映像1フレーム(基本ストリームの1フレーム)は、1125本のラインにより構成される。基本ストリームの1フレームの補助データ領域は、最大1125サンプル分の音声データ(32チャンネル分の1125サンプル音声データ)を多重可能な容量を有するから、基本ストリーム生成部13は、32チャンネル分の400サンプル音声データを多重することができる。
【0095】
これにより、基本ストリームの1フレームの補助データ領域を用いて、32チャンネル分の400サンプル音声データを伝送することができる。つまり、映像フレーム周波数が120Hzの場合、映像音声信号送信装置1は、1系統の基本ストリームを用いて、サンプリング周波数48kHzの音声データを32チャンネル分伝送することができる。
【0096】
図4に示したとおり、映像フレーム周波数が120Hzの場合、1本のリンク信号は、2個の基本ストリームを多重して生成される。これにより、映像音声信号送信装置1は、1本のリンク信号を構成する2個の基本ストリームのうち、任意の1個の基本ストリームの補助データ領域を用いて、サンプリング周波数48kHzの音声データを32チャンネル分伝送することができる。
【0097】
また、基本ストリーム生成部13は、他の1個の基本ストリームの補助データ領域に、音声制御パケットを格納する。これにより、映像音声信号送信装置1は、2N本のリンク信号のうち、1本のリンク信号のみを用いて、サンプリング周波数48kHzの32チャンネル分の音声データを含む音声データパケットと、音声制御パケットとを伝送することができる。
【0098】
尚、映像フレーム周波数が119.88Hz、100Hzの場合も同様である。映像フレーム周波数が119.88Hzの場合は、映像5フレーム分の時間で2002サンプル分の音声データを伝送すればよく、映像フレーム周波数が100Hzの場合は、映像1フレーム分の時間で480サンプル分の音声データを伝送すればよい。
【0099】
(1−3:音声サンプリング周波数48kHz、映像フレーム周波数30Hzの場合)
次に、音声サンプリング周波数が48kHz及び映像フレーム周波数が30Hzの場合の処理について説明する。この場合、基本ストリーム生成部13は、映像1フレームあたり、1600サンプル(=48kHz/30Hz)の音声データを多重する必要がある。
【0100】
図15は、音声サンプリング周波数が48kHz及び映像フレーム周波数が30Hzの場合の処理について説明する図である。前述のとおり、音声のサンプリング周波数が48kHzの場合、基本ストリームの1ラインの補助データ領域を用いて、32チャンネル分の1サンプル音声データを伝送することができる。
【0101】
図10に示したとおり、映像1フレーム(基本ストリームの1フレーム)は、1125本のラインにより構成される。基本ストリームの1フレームの補助データ領域は、最大1125サンプル分の音声データ(32チャンネル分の1125サンプル音声データ)を多重可能な容量を有するから、基本ストリーム生成部13は、1600サンプルの音声データ(32チャンネル分の1600サンプル音声データ)を多重することができない。つまり、基本ストリーム生成部13は、1系統における基本ストリームの1フレームの補助データ領域を用いて、32チャンネル分の1600サンプル音声データを多重することができないが、32チャンネル分の800サンプル音声データを多重することができる。32チャンネル分の800サンプル音声データは、16チャンネル分の1600サンプル音声データに相当する。
【0102】
そこで、基本ストリーム生成部13は、基本ストリームの1フレームについて800ライン分の補助データ領域を用いるようにし、32チャンネル分の音声データを2系統の16チャンネル分の音声データに分ける。この場合、基本ストリーム生成部13は、1系統につき、16チャンネル分の1600サンプル音声データを多重することができる。
【0103】
これにより、2系統における基本ストリームの1フレームの補助データ領域を用いて、32チャンネル分の1600サンプル音声データを伝送することができる。つまり、映像フレーム周波数が30Hzの場合、映像音声信号送信装置1は、2系統の基本ストリームを用いて、サンプリング周波数48kHzの音声データを32チャンネル分伝送することができる。
【0104】
図5に示したとおり、映像フレーム周波数が30Hzの場合、1本のリンク信号は、8個の基本ストリームを多重して生成される。これにより、映像音声信号送信装置1は、1本のリンク信号を構成する8個の基本ストリームのうち、任意の2個の基本ストリームの補助データ領域を用いて、サンプリング周波数48kHzの音声データを32チャンネル分伝送することができる。
【0105】
また、基本ストリーム生成部13は、他の6個の基本ストリームのうち、任意の2個の基本ストリームの補助データ領域に、音声制御パケットを格納する。これにより、映像音声信号送信装置1は、N/2本のリンク信号のうち、1本のリンク信号のみを用いて、サンプリング周波数48kHzの32チャンネル分の音声データを含む音声データパケットと、音声制御パケットとを伝送することができる。
【0106】
尚、映像フレーム周波数が29.97Hz、25Hz、24Hz、23.98Hzの場合も同様である。映像フレーム周波数が29.97Hzの場合は、映像5フレーム分の時間で8008サンプル分の音声データを伝送すればよい。また、映像フレーム周波数が25Hzの場合は、映像1フレーム分の時間で1920サンプル分の音声データ、映像フレーム周波数が24Hzの場合は、映像1フレーム分の時間で2000サンプル分の音声データ、映像フレーム周波数が23.98Hzの場合は、映像1フレーム分の時間で2002サンプル分の音声データをそれぞれ伝送すればよい。
【0107】
(2−1:音声サンプリング周波数96kHz、映像フレーム周波数60Hzの場合)
次に、音声サンプリング周波数が96kHz及び映像フレーム周波数が60Hzの場合の処理について説明する。この場合、基本ストリーム生成部13は、映像1フレームあたり、1600サンプル(=96kHz/60Hz)の音声データを多重する必要がある。
【0108】
図16は、音声サンプリング周波数が96kHz及び映像フレーム周波数が60Hzの場合の処理について説明する図である。前述のとおり、音声のサンプリング周波数が96kHzの場合、1個の音声データパケットには2チャンネル分の2サンプル音声データが格納され、基本ストリームの1ラインには8個の音声データパケットが格納される。つまり、基本ストリームの1ラインの補助データ領域を用いて、16チャンネル分の2サンプル音声データを伝送することができる。
【0109】
図10に示したとおり、映像1フレーム(基本ストリームの1フレーム)は、1125本のラインにより構成される。基本ストリームの1フレームの補助データ領域は、最大1125サンプル分の音声データ(32チャンネル分の1125サンプル音声データ、16チャンネル分の2×1125サンプル音声データ)を多重可能な容量を有するから、基本ストリーム生成部13は、1600サンプル分の音声データ(32チャンネル分の1600サンプル音声データ)を多重することができない。つまり、基本ストリーム生成部13は、1系統における基本ストリームの1フレームの補助データ領域を用いて、32チャンネル分の1600サンプル音声データを多重することができないが、32チャンネル分の800サンプル音声データを多重することができる。32チャンネル分の800サンプル音声データは、16チャンネル分の1600サンプル音声データに相当する。
【0110】
そこで、基本ストリーム生成部13は、基本ストリームの1フレームについて800ライン分の補助データ領域を用いるようにし、32チャンネル分の音声データを2系統の16チャンネル分の音声データに分ける。この場合、基本ストリーム生成部13は、1系統につき、16チャンネル分の1600サンプル音声データを多重することができる。
【0111】
これにより、2系統における基本ストリームの1フレームの補助データ領域を用いて、32チャンネル分の1600サンプル音声データを伝送することができる。つまり、映像フレーム周波数が60Hzの場合、映像音声信号送信装置1は、2系統の基本ストリームを用いて、サンプリング周波数96kHzの音声データを32チャンネル分伝送することができる。
【0112】
図3に示したとおり、映像フレーム周波数が60Hzの場合、1本のリンク信号は、4個の基本ストリームを多重して生成される。これにより、映像音声信号送信装置1は、1本のリンク信号を構成する4個の基本ストリームのうち、任意の2個の基本ストリームの補助データ領域を用いて、サンプリング周波数96kHzの音声データを32チャンネル分伝送することができる。
【0113】
また、基本ストリーム生成部13は、他の2個の基本ストリームの補助データ領域に、音声制御パケットを格納する。これにより、映像音声信号送信装置1は、N本のリンク信号のうち、1本のリンク信号のみを用いて、サンプリング周波数96kHzの32チャンネル分の音声データを含む音声データパケットと、音声制御パケットとを伝送することができる。
【0114】
尚、映像フレーム周波数が59.94Hz、50Hzの場合も同様である。映像フレーム周波数が59.94Hzの場合は、映像5フレーム分の時間で8008サンプル分の音声データを伝送すればよく、映像フレーム周波数が50Hzの場合は、映像1フレーム分の時間で1920サンプル分の音声データを伝送すればよい。
【0115】
(2−2:音声サンプリング周波数96kHz、映像フレーム周波数120Hzの場合)
次に、音声サンプリング周波数が96kHz及び映像フレーム周波数が120Hzの場合の処理について説明する。この場合、基本ストリーム生成部13は、映像1フレームあたり、800サンプル(=96kHz/120Hz)の音声データを多重する必要がある。
【0116】
図17は、音声サンプリング周波数が96kHz及び映像フレーム周波数が120Hzの場合の処理について説明する図である。
図17(1)は、1系統の基本ストリームを用いて音声信号を伝送する場合を示し、
図17(2)は、2系統の基本ストリームを用いて音声信号を伝送する場合(16チャンネル毎に伝送する場合)を示す。前述のとおり、音声のサンプリング周波数が96kHzの場合、基本ストリームの1ラインの補助データ領域を用いて、16チャンネル分の2サンプル音声データを伝送することができる。
【0117】
図10に示したとおり、映像1フレーム(基本ストリームの1フレーム)は、1125本のラインにより構成される。基本ストリームの1フレームの補助データ領域は、最大1125サンプル分の音声データ(32チャンネル分の1125サンプル音声データ、16チャンネル分の2×1125サンプル音声データ)を多重可能な容量を有するから、基本ストリーム生成部13は、
図17(1)に示すように、基本ストリームの1フレームについて800ライン分の補助データ領域を用いて、16チャンネル分の1600サンプル音声データを多重することができる。16チャンネル分の1600サンプル音声データは、32チャンネル分の800サンプル音声データに相当する。
【0118】
これにより、基本ストリームの1フレームの補助データ領域を用いて、32チャンネル分の800サンプル音声データを伝送することができる。つまり、映像フレーム周波数が120Hzの場合、映像音声信号送信装置1は、1系統の基本ストリームを用いて、サンプリング周波数96kHzの音声データを32チャンネル分伝送することができる。
【0119】
図4に示したとおり、映像フレーム周波数が120Hzの場合、1本のリンク信号は、2個の基本ストリームを多重して生成される。これにより、映像音声信号送信装置1は、1本のリンク信号を構成する2個の基本ストリームのうち、任意の1個の基本ストリームの補助データ領域を用いて、サンプリング周波数96kHzの音声データを32チャンネル分伝送することができる。
【0120】
また、基本ストリーム生成部13は、他の1個の基本ストリームの補助データ領域に、音声制御パケットを格納する。これにより、映像音声信号送信装置1は、2N本のリンク信号のうち、1本のリンク信号のみを用いて、サンプリング周波数96kHzの32チャンネル分の音声データを含む音声データパケットと、音声制御パケットとを伝送することができる。
【0121】
尚、映像フレーム周波数が119.88Hz、100Hzの場合も同様である。映像フレーム周波数が119.88Hzの場合は、映像5フレーム分の時間で4004サンプル分の音声データを伝送すればよく、映像フレーム周波数が100Hzの場合は、映像1フレーム分の時間で1000サンプル分の音声データを伝送すればよい。
【0122】
また、サンプリング周波数が96kHzの場合、基本ストリームの1ラインの補助データ領域を用いて、16チャンネル分の2サンプル音声データを伝送する。このため、16チャンネル毎の音声データに分けた方が、映像フレーム周波数が60Hzの場合と整合性を取り易い。
【0123】
そこで、基本ストリーム生成部13は、
図17(2)に示すように、基本ストリームの1フレームについて400ライン分の補助データ領域を用いるようにし、32チャンネル分の音声データを2系統の16チャンネル分の音声データに分ける。この場合、基本ストリーム生成部13は、1系統につき、16チャンネル分の800サンプル音声データを多重することができる。
【0124】
これにより、2系統における基本ストリームの1フレームの補助データ領域(400ライン分の補助データ領域)を用いて、32チャンネル分の800サンプル音声データを伝送することができる。つまり、映像フレーム周波数が120Hzの場合、映像音声信号送信装置1は、2系統の基本ストリームを用いて、サンプリング周波数96kHzの音声データを32チャンネル分伝送することができる。
【0125】
この場合、映像音声信号送信装置1は、1本のリンク信号を構成する2個の基本ストリームのうち、任意の1個の基本ストリーム(基本ストリーム1)の補助データ領域を用いて、サンプリング周波数96kHzの音声データを16チャンネル分伝送することができる。また、映像音声信号送信装置1は、他のリンク信号を構成する2個の基本ストリームのうち、任意の1個の基本ストリーム(基本ストリーム3)の補助データ領域を用いて、サンプリング周波数96kHzの音声データを16チャンネル分伝送することができる。
【0126】
また、基本ストリーム生成部13は、リンク信号を構成する2個の基本ストリームのうち、他の1個の基本ストリーム(基本ストリーム2,4)の補助データ領域に、音声制御パケットをそれぞれ格納する。これにより、映像音声信号送信装置1は、4N本のリンク信号のうち、2本のリンク信号のみを用いて、サンプリング周波数96kHzの32チャンネル分の音声データを含む音声データパケットと、音声制御パケットとを伝送することができる。
【0127】
(2−3:音声サンプリング周波数96kHz、映像フレーム周波数30Hzの場合)
次に、音声サンプリング周波数が96kHz及び映像フレーム周波数が30Hzの場合の処理について説明する。この場合、基本ストリーム生成部13は、映像1フレームあたり、3200サンプル(=96kHz/30Hz)の音声データを多重する必要がある。
【0128】
図18は、音声サンプリング周波数が96kHz及び映像フレーム周波数が30Hzの場合の処理について説明する図である。前述のとおり、音声のサンプリング周波数が96kHzの場合、基本ストリームの1ラインの補助データ領域を用いて、16チャンネル分の2サンプル音声データを伝送することができる。
【0129】
図10に示したとおり、映像1フレーム(基本ストリームの1フレーム)は、1125本のラインにより構成される。基本ストリームの1フレームの補助データ領域は、最大1125サンプル分の音声データ(32チャンネル分の1125サンプル音声データ、16チャンネル分の2×1125サンプル音声データ)を多重可能な容量を有するから、基本ストリーム生成部13は、3200サンプル分の音声データ(32チャンネル分の3200サンプル音声データ)を多重することができない。つまり、基本ストリーム生成部13は、1系統における基本ストリームの1フレームの補助データ領域を用いて、32チャンネル分の3200サンプル音声データを多重することができないが、32チャンネル分の800サンプル音声データを多重することができる。32チャンネル分の800サンプル音声データは、8チャンネル分の3200サンプル音声データ(16チャンネル分の1600サンプル音声データ)に相当する。
【0130】
そこで、基本ストリーム生成部13は、基本ストリームの1フレームについて800ライン分の補助データ領域を用いるようにし、32チャンネル分の音声データを4系統の8チャンネル分の音声データに分ける。この場合、基本ストリーム生成部13は、1系統につき、8チャンネル分の3200サンプル音声データ(16チャンネル分の1600サンプル音声データ)を多重することができる。
【0131】
これにより、4系統における基本ストリームの1フレームの補助データ領域を用いて、32チャンネル分の3200サンプル音声データを伝送することができる。つまり、映像フレーム周波数が30Hzの場合、映像音声信号送信装置1は、4系統の基本ストリームを用いて、サンプリング周波数96kHzの音声データを32チャンネル分伝送することができる。
【0132】
図5に示したとおり、映像フレーム周波数が30Hzの場合、1本のリンク信号は、8個の基本ストリームを多重して生成される。これにより、映像音声信号送信装置1は、1本のリンク信号を構成する8個の基本ストリームのうち、任意の4個の基本ストリームの補助データ領域を用いて、サンプリング周波数96kHzの音声データを32チャンネル分伝送することができる。
【0133】
また、基本ストリーム生成部13は、他の4個の基本ストリームの補助データ領域に、音声制御パケットを格納する。これにより、映像音声信号送信装置1は、N/2本のリンク信号のうち、1本のリンク信号のみを用いて、サンプリング周波数96kHzの32チャンネル分の音声データを含む音声データパケットと、音声制御パケットとを伝送することができる。
【0134】
尚、映像フレーム周波数が29.97Hz、25Hz、24Hz、23.98Hzの場合も同様である。映像フレーム周波数が29.97Hzの場合は、映像5フレーム分の時間で16016サンプル分の音声データを伝送すればよい。また、映像フレーム周波数が25Hzの場合は、映像1フレーム分の時間で3840サンプル分の音声データ、映像フレーム周波数が24Hzの場合は、映像1フレーム分の時間で4000サンプル分の音声データ、映像フレーム周波数が23.98Hzの場合は、映像1フレーム分の時間で4004サンプル分の音声データをそれぞれ伝送すればよい。
【0135】
以上のように、本発明の実施形態による映像音声信号送信装置1によれば、UHDTV用の映像信号及び32チャンネルの音声信号を入力し、映像信号のソースイメージを分割して複数のサブイメージを生成し、サブイメージ毎に、当該サブイメージを分割して複数の基本イメージを生成し、基本イメージ毎に、当該基本イメージから対応する系統の基本ストリームを生成し、複数系統の基本ストリームを合成してリンク信号を生成し送信する際に、音声データパケット生成部15は、音声信号を構成するチャンネル毎の音声データをUDW領域に格納し、補助データパケットと同じ構成の音声データパケットを生成するようにした。また、音声制御パケット生成部16は、音声信号を構成するチャンネル毎の音声データに含まれるC(チャンネルステータスビット)に基づいて音声制御データを生成し、音声制御データをUDW領域に格納し、補助データパケットと同じ構成の音声制御パケットを生成するようにした。
【0136】
そして、基本ストリーム生成部13は、基本イメージから画素のラインデータを順次取り出し、取り出した画素のラインデータを基本ストリームの有効映像領域に格納すると共に、音声データパケットを基本ストリームの補助データ領域に格納し、音声データパケットを格納した基本ストリームとは異なる系統において、音声制御パケットを基本ストリームの補助データ領域に格納するようにした。これにより、映像信号及び音声信号を多重した基本ストリームが生成され、リンク信号として送信される。
【0137】
このように、映像音声信号送信装置1は、UHDTV用の音声信号の規格(非特許文献2:ARIB標準規格STD−B59)に規定された音声信号を、UHDTV用のインタフェースの規格(非特許文献1:ARIB標準規格STD−B58)に規定された補助データ領域に格納することで、UHDTV用の映像信号及び音声信号を多重し、1本のケーブルにて伝送する。
【0138】
したがって、UHDTV用のインタフェースを用いて、映像信号だけでなく音声信号を同時に伝送することができ、さらにこれらの信号を同期させて伝送することができるため、簡便な伝送を実現すると共に、放送設備同士で信号を送受信する場合の利便性が向上する。
【0139】
〔映像音声信号受信装置〕
次に、
図1に示した映像音声信号受信装置2について詳細に説明する。
図19は、映像音声信号受信装置2の構成を示すブロック図である。この映像音声信号受信装置2は、基本ストリーム復元部21、基本イメージ復元部22、サブイメージ復元部23、ソースイメージ復元部24、音声データパケット復元部25及び音声制御パケット復元部26を備えている。
【0140】
映像音声信号受信装置2は、映像音声信号送信装置1から1以上の色信号コンポーネントからなる動画像の映像信号を10.692Gbit/sの所定数のリンク信号(シリアルデータストリーム)として受信する。
【0141】
映像音声信号受信装置2の基本ストリーム復元部21は、所定数のリンク信号を入力し、
図2に示したリンク信号生成部14の逆の処理により、所定数のリンク信号に対して復号処理等を施し、
図3〜
図5に示したとおり、1本のリンク信号につき所定数の基本ストリームを復元する。
【0142】
基本イメージ復元部22は、基本ストリーム復元部21により復元された基本ストリームを入力し、
図2に示した基本ストリーム生成部13の逆の処理により、基本ストリームの有効映像領域から映像信号のデータである画素のラインデータを抽出し、抽出した画素のラインデータを所定の順序で配列して基本イメージを復元する。
【0143】
サブイメージ復元部23は、基本イメージ復元部22により復元された基本イメージを入力し、
図2に示した基本イメージ生成部12の逆の処理により、
図3〜
図5に示したとおり、複数の基本イメージを所定の順序で多重化(合成)し、サブイメージを復元する。
【0144】
ソースイメージ復元部24は、サブイメージ復元部23により復元されたサブイメージを入力し、
図2に示したサブイメージ生成部11の逆の処理により、複数のサブイメージを、所定の順序で多重化(合成)し、ソースイメージを復元する。これにより、色信号コンポーネント毎のソースイメージが復元される。そして、ソースイメージ復元部24は、復元した色信号コンポーネント毎のソースイメージを、元の映像信号として出力する。
【0145】
音声データパケット復元部25は、基本ストリーム復元部21により復元された基本ストリームを入力すると共に、音声制御パケット復元部26から音声制御データを入力し、基本ストリームから音声データパケットを抽出(復元)する。
【0146】
そして、音声データパケット復元部25は、
図7及び
図8にて音声信号から音声データパケットを生成する音声データパケット生成部15の逆の処理を行う。具体的には、音声データパケット復元部25は、音声データパケットから音声データを抽出し、抽出した音声データ及び入力した音声制御データからAESサブフレームである1サンプル音声データを復元し、AESサブフレームを組み合わせて音声信号を復元し出力する。
【0147】
音声制御パケット復元部26は、基本ストリーム復元部21により復元された基本ストリームを入力し、基本ストリームから音声制御パケットを抽出する。そして、音声制御パケット復元部26は、
図2に示した音声制御パケット生成部16の逆の処理を行う。具体的には、音声制御パケット復元部26は、音声制御パケットから音声制御データを抽出し、音声制御データを音声データパケット復元部25等に出力する。
【0148】
このように、映像音声信号受信装置2により、受信した所定数のリンク信号から、複数の色信号コンポーネントからなる動画像の映像信号及び音声信号が復元される。
【0149】
尚、基本ストリーム復元部21、基本イメージ復元部22、サブイメージ復元部23及びソースイメージ復元部24の処理の詳細については、映像信号のみを送受信する手法について記載された前述の特許文献1を参照されたい。
【0150】
〔音声データパケット復元部〕
次に、
図19に示した音声データパケット復元部25について詳細に説明する。
図20は、音声データパケット復元部25の処理を示すフローチャートである。音声データパケット復元部25は、まず、基本ストリーム復元部21から系統毎の基本ストリームを入力すると共に、音声制御パケット復元部26から音声制御データを入力する(ステップS2001)。
【0151】
音声データパケット復元部25は、系統毎に、基本ストリームのラインの補助データ領域に格納されたADFのデータ(補助データパケットと同じ構成の音声データパケットのADF領域に格納された所定データ、
図6〜
図8を参照)を検索し、補助データ領域からパケットを抽出する(ステップS2002)。そして、音声データパケット復元部25は、パケットのDID領域に格納されたデータに基づいて音声データパケットを特定し、補助データ領域から音声データパケットを抽出することで、音声データパケットを復元する(ステップS2003)。
【0152】
DID領域には、パケットの種類を示す識別情報が格納されている。前述のとおり、音声データパケットが伝送された系統において、基本ストリームのラインの補助データ領域には、8個の音声データパケットが格納されている。音声データパケット復元部25は、音声データパケットが伝送された系統において、基本ストリームのラインの補助データ領域から、8個の音声データパケットを抽出することができる。つまり、基本ストリームの1ラインから8個の音声データパケットが復元される。
【0153】
音声データパケット復元部25は、音声データパケットのUDW領域から、4ワード毎の1サンプル音声データを抽出する(ステップS2004)。そして、音声データパケット復元部25は、
図9に示した処理とは逆の処理を行い、4ワードの1サンプル音声データ及び音声制御パケット復元部26から入力した音声制御データからAESサブフレームを復元する(ステップS2005)。例えば、音声データパケット復元部25は、音声制御データに含まれるチャンネルの有効性を示す情報を用いて、有効なチャンネルのみのAESサブフレームを復元する。
【0154】
尚、音声データパケット復元部25は、音声制御パケット復元部26から入力した音声制御データを用いることなく、4ワードの1サンプル音声データからAESサブフレームを生成するようにしてもよい。この場合、音声信号は、音声制御パケットから抽出された音声制御データを用いることなく、音声データパケットから抽出された1サンプル音声データを用いて復元される。
【0155】
音声データパケット復元部25は、
図7及び
図8に示したように、1サンプル音声データ毎のAESサブフレームを組み合わせて音声信号を復元し、出力する(ステップS2006)。これにより、音声のサンプリング周波数が48kHzの場合、
図7に示した上段の音声信号が復元され、音声のサンプリング周波数が96kHzの場合、
図8に示した上段の音声信号が復元される。
【0156】
〔音声制御パケット復元部〕
次に、
図19に示した音声制御パケット復元部26について詳細に説明する。
図21は、音声制御パケット復元部26の処理を示すフローチャートである。音声制御パケット復元部26は、まず、基本ストリーム復元部21から系統毎の基本ストリームを入力する(ステップS2101)。
【0157】
音声制御パケット復元部26は、系統毎に、基本ストリームのラインの補助データ領域に格納されたADFのデータ(補助データパケットと同じ構成の音声制御パケットのADF領域に格納された所定データ、
図6を参照)を検索し、補助データ領域からパケットを抽出する(ステップS2102)。そして、音声制御パケット復元部26は、パケットのDID領域に格納されたデータに基づいて音声制御パケットを特定し、補助データ領域から音声制御パケットを抽出することで、音声制御パケットを復元する(ステップS2103)。DID領域には、パケットの種類を示す識別情報が格納されているから、パケットのDID領域に格納されたデータに基づいて、音声制御パケットを抽出することができる。
【0158】
音声制御パケット復元部26は、音声制御パケットのUDW領域から、音声制御データを抽出し(ステップS2104)、音声制御データを音声データパケット復元部25及び再生部(
図19には図示せず)等に出力する(ステップS2105)。音声制御データは、音声データパケット復元部25において、音声信号を復元するために用いられ、再生部において、音声信号を再生するために用いられる。
【0159】
このように、映像音声信号受信装置2は、基本イメージ復元部22において、映像信号と音声信号とが多重された基本ストリームから映像の基本イメージを復元し、音声データパケット復元部25において、映像信号と音声信号とが多重された基本ストリームから音声信号を復元する。
【0160】
以上のように、本発明の実施形態による映像音声信号受信装置2によれば、映像音声信号送信装置1から送信された複数のリンク信号を受信し、リンク信号毎に、当該リンク信号から複数の基本ストリームを復元し、基本ストリームから対応する基本イメージを復元し、複数の基本イメージを合成してサブイメージを生成し、複数のサブイメージを合成してUHDTV用の映像信号を復元し出力する際に、音声制御パケット復元部26は、復元された基本ストリームの補助データ領域に格納された音声制御パケットを特定(復元)し、音声制御パケットのUDW領域から音声制御データを抽出するようにした。
【0161】
また、音声データパケット復元部25は、復元された基本ストリームの補助データ領域に格納された音声データパケットを特定(復元)し、音声データパケットのUDW領域から1サンプル音声データを抽出し、1サンプル音声データ及び音声制御データからAESサブフレームを生成し、音声信号を復元して出力するようにした。これにより、映像信号及び音声信号が多重された基本ストリームから映像信号及び音声信号を復元することができる。
【0162】
このように、映像音声信号送信装置1により、UHDTV用の音声信号の規格(非特許文献2:ARIB標準規格STD−B59)に規定された音声信号が、UHDTV用のインタフェースの規格(非特許文献1:ARIB標準規格STD−B58)に規定された補助データ領域に格納され、UHDTV用の映像信号及び音声信号が多重され、1本のケーブルにて伝送された場合に、映像音声信号受信装置2は、多重された映像信号及び音声信号を受信し、音声信号を補助データ領域から抽出し、元の映像信号及び音声信号を復元する。
【0163】
したがって、UHDTV用のインタフェースを用いて、映像信号だけでなく音声信号を同時に伝送することができ、さらにこれらの信号を同期させて伝送することができるため、簡便な伝送を実現すると共に、放送設備同士で信号を送受信する場合の利便性が向上する。
【0164】
以上、実施形態を挙げて本発明を説明したが、本発明は前記実施形態に限定されるものではなく、その技術思想を逸脱しない範囲で種々変形可能である。前記実施形態では、N本または2N本のリンク信号のうち、1本のリンク信号のみを用いて、音声データパケット及び音声制御パケットを伝送するようにしたが、リンク信号の割り当ては任意でよい。また、音声データパケットと音声制御パケットとを、異なるリンク信号を用いて伝送するようにしてもよい。また、音声データパケットと音声制御パケットとを、異なる系統の基本ストリームに格納するようにしたが、同じ系統の基本ストリームに格納するようにしてもよい。
【0165】
また、前記実施形態は、音声信号のチャンネル数を32チャンネルとして説明したが、本発明は、32チャンネルに限定するものではなく、32チャンネル以上の音声信号を伝送する場合にも適用がある。
【0166】
尚、本発明の実施形態による映像音声信号送信装置1及び映像音声信号受信装置2のハードウェア構成としては、通常のコンピュータを使用することができる。映像音声信号送信装置1及び映像音声信号受信装置2は、CPU、RAM等の揮発性の記憶媒体、ROM等の不揮発性の記憶媒体、及びインタフェース等を備えたコンピュータによって構成される。映像音声信号送信装置1に備えたサブイメージ生成部11、基本イメージ生成部12、基本ストリーム生成部13、リンク信号生成部14、音声データパケット生成部15及び音声制御パケット生成部16の各機能は、これらの機能を記述したプログラムをCPUに実行させることによりそれぞれ実現される。また、映像音声信号受信装置2に備えた基本ストリーム復元部21、基本イメージ復元部22、サブイメージ復元部23、ソースイメージ復元部24、音声データパケット復元部25及び音声制御パケット復元部26の各機能も、これらの機能を記述したプログラムをCPUに実行させることによりそれぞれ実現される。
【0167】
これらのプログラムは、前記記憶媒体に格納されており、CPUに読み出されて実行される。また、これらのプログラムは、磁気ディスク(フロッピー(登録商標)ディスク、ハードディスク等)、光ディスク(CD−ROM、DVD等)、半導体メモリ等の記憶媒体に格納して頒布することもでき、ネットワークを介して送受信することもできる。