特許第6335913号(P6335913)IP Force 特許公報掲載プロジェクト 2022.1.31 β版

知財求人 - 知財ポータルサイト「IP Force」

▶ スケーラブル ビデオ システムズ ゲーエムベーハーの特許一覧

特許6335913映像処理装置および同装置を操作する方法
<>
  • 特許6335913-映像処理装置および同装置を操作する方法 図000002
  • 特許6335913-映像処理装置および同装置を操作する方法 図000003
  • 特許6335913-映像処理装置および同装置を操作する方法 図000004
  • 特許6335913-映像処理装置および同装置を操作する方法 図000005
  • 特許6335913-映像処理装置および同装置を操作する方法 図000006
  • 特許6335913-映像処理装置および同装置を操作する方法 図000007
  • 特許6335913-映像処理装置および同装置を操作する方法 図000008
  • 特許6335913-映像処理装置および同装置を操作する方法 図000009
  • 特許6335913-映像処理装置および同装置を操作する方法 図000010
  • 特許6335913-映像処理装置および同装置を操作する方法 図000011
< >
(19)【発行国】日本国特許庁(JP)
(12)【公報種別】特許公報(B2)
(11)【特許番号】6335913
(24)【登録日】2018年5月11日
(45)【発行日】2018年5月30日
(54)【発明の名称】映像処理装置および同装置を操作する方法
(51)【国際特許分類】
   H04N 5/222 20060101AFI20180521BHJP
   H04N 5/265 20060101ALI20180521BHJP
   H04N 5/272 20060101ALI20180521BHJP
   H04N 5/917 20060101ALI20180521BHJP
【FI】
   H04N5/222
   H04N5/265
   H04N5/272
   H04N5/917
【請求項の数】6
【全頁数】13
(21)【出願番号】特願2015-542250(P2015-542250)
(86)(22)【出願日】2013年11月12日
(65)【公表番号】特表2015-537474(P2015-537474A)
(43)【公表日】2015年12月24日
(86)【国際出願番号】EP2013073663
(87)【国際公開番号】WO2014076102
(87)【国際公開日】20140522
【審査請求日】2016年11月9日
(31)【優先権主張番号】12193098.6
(32)【優先日】2012年11月16日
(33)【優先権主張国】EP
(73)【特許権者】
【識別番号】515131242
【氏名又は名称】スケーラブル ビデオ システムズ ゲーエムベーハー
【氏名又は名称原語表記】SCALABLE VIDEO SYSTEMS GMBH
(74)【代理人】
【識別番号】100105957
【弁理士】
【氏名又は名称】恩田 誠
(74)【代理人】
【識別番号】100068755
【弁理士】
【氏名又は名称】恩田 博宣
(74)【代理人】
【識別番号】100142907
【弁理士】
【氏名又は名称】本田 淳
(72)【発明者】
【氏名】オブストフェルダー、ユルゲン
【審査官】 ▲徳▼田 賢二
(56)【参考文献】
【文献】 特開2000−083193(JP,A)
【文献】 特開2003−153080(JP,A)
(58)【調査した分野】(Int.Cl.,DB名)
H04N 5/222
H04N 5/265
H04N 5/272
H04N 5/917
(57)【特許請求の範囲】
【請求項1】
パケット化されたデータを通信するためにデータリンク(304)によって接続された複数の入力ユニット(301A〜301D)および処理ユニット(303)を含む映像処理装置を操作する方法であって、前記処理ユニット(303)は少なくとも2つの映像入力信号に基づいて合成画像を形成するように構成されており、前記方法は、
a)前記複数の入力ユニット(301A〜301D)で複数の映像入力信号(305A〜305D)を受信するステップと、
b)前記合成画像(401)の主要部分(402)を形成する主映像入力信号を選択するステップと、
c)前記合成画像(401)内の予め定められた位置に予め定められたサイズの前記合成画像(401)の一部分(403〜405)を形成するための追加映像入力信号を選択するステップと、
d)前記合成画像(401)内の予め定められた位置および予め定められたサイズの前記一部分を選択するステップと、
e)選択された画像部分(403〜405)に関する情報を前記入力ユニット(301A〜301D)の1つに送信するステップと、
f)前記合成画像の前記選択された部分を形成する前記映像入力信号の部分のみを前記データリンク(304)を介して前記処理ユニット(303)に送信するように前記1つの入力ユニット(301A〜301D)に要求するステップと、
g)選択された前記追加映像入力信号を前記主映像入力信号内に挿入するためのキー信号を生成するステップと、を備える方法。
【請求項2】
前記ステップc)〜)を繰り返すステップをさらに備える請求項1に記載の方法。
【請求項3】
前記選択された画像部分(403〜405)に関する情報を、前記主映像入力信号を提供する前記入力ユニットに送信して、この入力ユニットが前記選択された画像部分に対応する前記主映像入力信号の部分を送信することを防止するステップをさらに備える請求項1又は2に記載の方法。
【請求項4】
前記選択された映像入力信号を前記処理ユニット(303)のレベルで処理して前記合成画像(401)を形成するステップをさらに備える請求項1〜3の何れか一項に記載の方法。
【請求項5】
前記処理ユニットに前記キー信号を輝度信号としてのみ送信するステップをさらに備える請求項に記載の方法。
【請求項6】
像信号を処理するための処理装置であって、前記処理装置は処理ユニット(303)と複数の入力ユニット(301A〜301D)とを含み、前記処理ユニット(303)および前記複数の入力ユニット(301A〜301D)は、デジタルデータをパケット化形式で交換するためにデータリンク(304)によって通信可能に接続され、前記パケット化されたデータは、前記処理ユニット(303)と前記複数の入力ユニット(301A〜301D)との間で通信される映像信号およびコマンド信号のうちの少なくとも一方を表し、前記複数の入力ユニットは、複数の映像入力信号(305A〜305D)を受信するように構成され、前記複数の映像入力信号の1つは、合成画像の主要部分(402)を形成する主映像入力信号として選択され、別の映像入力信号は、前記合成画像(401)内の予め定められた位置に予め定められたサイズの前記合成画像(401)の一部分(403〜405)を形成する追加映像入力信号として選択され、前記処理ユニット(303)は、前記合成画像(401)内の予め定められた位置および予め定められたサイズの前記一部分を選択するとともに、選択された画像部分(403〜405)に関する情報を前記複数の入力ユニット(301A〜301D)のうちの1つに送信して、前記複数の入力ユニットのうちの1つに、前記合成画像の前記選択された部分を形成する前記入力信号の部分のみを送信することを要求するように構成されており、
前記処理ユニット(303)は選択された前記追加映像入力信号を前記主映像入力信号内に挿入するためのキー信号を生成するように構成されている、処理装置。
【発明の詳細な説明】
【技術分野】
【0001】
第1態様によれば、本発明は映像/音声処理装置を操作する方法に関し、特に請求項1に係る方法に関する。第2態様によれば、本発明は映像/音声処理装置に関する。
【背景技術】
【0002】
テレビ制作のようなライブ映像制作は今日、ビジョンミキサを用いて実現される。ビジョンミキサは例えばグラス・バレー(Grass Valley)、ソニー(Sony)、スネル・アンド・ウィルコックス(Snell & Wilcox)、およびロス(Ross)などの会社から市販されている。
【0003】
ビジョンミキサ(映像スイッチャ、映像ミキサ、制作スイッチャ、または単にミキサとも呼ばれる)は、異なる映像入力信号から選択して映像出力信号を生成するために使用される装置である。様々な種類の遷移を作成する以外に、ビジョンミキサは多数の映像効果を生成することができ、キーヤー(keyers)、マット(matte)生成器、テキスト生成器等を含む。ビジョンミキサによって、ユーザは様々なソースから選択可能な宛先への信号のルーティングも制御する。
【0004】
ビジョンミキサは、映像信号に付随する音声信号のルーティングおよび切替えも実行する。しかし、映像信号の処理は音声信号の処理よりも複雑であるので、本願は映像信号に重点を置く。本願の文脈において、映像信号の処理は、付随する音声信号の対応する処理も含意することを理解されたい。本発明の説明を明瞭にするために、音声信号は必ずしも映像信号に加えて言及しない。
【0005】
ビジョンミキサの多数の機能性を可能にするために、ビジョンミキサは映像信号を処理する多数のハードウェアコンポーネントで構成される。処理用ハードウェアコンポーネントは1つの筐体内に配置され、全ての映像処理用ハードウェアをリアルタイムで制御してライブ制作の高速制御要件を満たすためにローカルバスソリューションと接続される。
【0006】
従来のビジョンミキサは、中央ミキシング電子装置、幾つかの入力チャネルおよび少なくとも1つの出力チャネル、制御ユニット、ならびにユーザインタフェースを含む。そのような種類のビジョンミキサは例えば特許文献1に記載されている。
【0007】
ミキシング電子装置には100個またはそれ以上の映像入力信号が同時に供給される。入力信号はカメラからのライブ映像信号、アーカイブ素材のようなサーバからの記録映像クリップ、専用スローモーションサーバからのスローモーションクリップ、グラフィック生成器からの合成画像、アニメーションおよび英数字記号である。現在まで、映像を処理するためにFPGA(フィールドプログラマブルゲートアレイ)が使用されている。
【0008】
現在のビジョンミキサは高価であり、かつ操作が難しい。特許文献2(欧州特許出願第12175474.1号)は、専用ハードウェアに基づく今日の既存の映像処理システム/映像制作システムをIPネットワーク構造によって通信可能に接続されたグラフィック処理ユニット(GPU)ベースの処理ユニットに置き換えることを提案している。典型的には、ネットワークはTCP/IPプロトコルによって動作する。原則的に、このシステムは任意のソースまたは入力信号を任意の宛先にルーティングすることを可能にする。しかし、IPネットワークの現在利用可能な帯域幅は、任意の入力信号を任意の宛先への同時ルーティングを不能にする。
【0009】
Boutaba Rらは、非特許文献1にて分散映像制作について記載している。非特許文献1は、遅延の問題、遅延変動、およびインターメディアスキュー要件に取り組むものである。Boutabaらは、遅延性能が遅延変動または「ジッタ」に基づいて測定されることを明言している。ジッタは、中間スイッチングノードにおけるバッファ占有率の変動のためネットワークの異なるパケットに生じる遅延差の尺度である。別の形のジッタは、ストリーム間ジッタすなわち「スキュー」であり、それは同一アプリケーションに関する別々のストリーム(例えば音声および映像)によって見られる遅延差を測定する。適切なストリーム内同期を確実にするために、低い遅延変動がしばしば要求される。Boutabaらは、データストリームをバッファリングすることによってジッタを補償することを提唱している。これは、ジッタを補償するために、充分に長い区間の映像および音声データを格納することが可能な充分なメモリを備えることを必要とする。高解像度映像データの場合、これは大きい格納容量を必要とする。
【0010】
特許文献3は、サーバおよびクライアント装置を含む画像視聴システムを開示している。サーバは基本解像度画像を送信する。仮想レンズは、関心領域に対応する基本解像度画像の一部分をより高い解像度で表示することを可能にする。クライアント装置のユーザは、仮想レンズの配置およびサイズを動的に制御することができる。この視聴システムは、高解像度画像全体をネットワークで送信する必要性を回避する。
【先行技術文献】
【特許文献】
【0011】
【特許文献1】独国特許出願公開第10336214号明細書
【特許文献2】欧州特許出願公開第2683155号明細書
【特許文献3】米国特許出願公開第2012/0011568号明細書
【非特許文献】
【0012】
【非特許文献1】”Distributed Video Production: Tasks, Architecture and QoS Provisioning”, Boutaba R et al., Multimedia Tools and Applications, Kluwer Academic Publishers, Boston, US, Volume 16, Number 1-2, January 1, 2002, pages 99-136
【発明の概要】
【発明が解決しようとする課題】
【0013】
本発明は、IPネットワーク構造によって接続された分散映像/音声処理システムに関連する帯域幅の問題を緩和することを目的とする。
【課題を解決するための手段】
【0014】
第1態様によれば、本発明は、パケット化されたデータを通信するためにデータリンクによって接続された複数の入力ユニットおよび処理ユニットを含むシステムにおいて映像/音声処理装置を操作する方法を提案する。方法は、
a)前記複数の入力ユニットで複数の入力信号を受信するステップと、
b)合成画像の主要部分を形成する主入力信号を選択するステップと、
c)前記合成画像内の予め定められた位置に予め定められたサイズの前記合成画像の一部分を形成するための追加入力信号を選択するステップと、
d)前記合成画像内の予め定められた位置および予め定められたサイズの前記一部分を選択するステップと、
e)前記選択された画像部分に関する情報を前記入力ユニットの1つに送信するステップと、
f)前記合成画像の前記選択された部分を形成する前記入力信号の部分のみを送信するように前記1つの入力ユニットに要求するステップと、
を備える。
【0015】
本発明の方法は、合成画像の選択された部分を形成する入力信号の部分のみを送信することにより、追加入力信号を提供するために必要とされる要求帯域幅を著しく低減することを可能にする。合成画像を形成するために幾つの追加入力信号が含まれるかに関係なく、合成画像を伝送するために必要な帯域幅は、フルサイズ入力信号を伝送するために要求される帯域幅の最大2倍に限定される。
【0016】
有利には、方法は、前記ステップd)〜f)を繰り返すステップをさらに備える。
有利な実施形態では、方法は、前記選択された画像部分に関する情報を、前記主入力信号を提供する前記入力ユニットに送信して、この入力ユニットが前記選択された画像部分に対応する前記主入力信号の部分を送信することを防止するステップをさらに備える。
【0017】
別の実施形態では、方法は、前記選択された入力信号を前記処理ユニットのレベルで処理して前記合成画像を形成するステップをさらに備える。
本発明のさらに別の実施形態では、方法は、前記選択された追加入力信号を前記主入力信号に挿入するためのキー信号を生成するステップをさらに備える。この場合、方法は、前記処理ユニットに前記キー信号を輝度信号としてのみ送信するステップをさらに備えることができる。
【0018】
第2態様によれば、本発明は、映像および/または音声信号を処理するための処理装置を提案する。処理装置は、処理ユニットおよび少なくとも1つの入力ユニットを含む。前記処理ユニットおよび前記入力ユニットは、デジタルデータをパケット化形式で交換するためにデータリンクによって通信可能に接続される。前記パケット化されたデータは、前記処理ユニットと前記少なくとも1つの入力ユニットとの間で通信される映像および/または音声信号および/またはコマンド信号を表す。前記少なくとも1つの入力ユニットは、複数の入力信号を受信するように構成されている。前記複数の入力信号の1つは、前記合成画像の主要部分を形成する主入力信号として選択され、別の入力信号は、前記合成画像内の予め定められた位置に予め定められたサイズの前記合成画像の一部分を形成する追加入力信号として選択される。前記処理ユニットは、前記合成画像内の予め定められた位置および予め定められたサイズの前記一部分を選択するとともに、前記選択された画像部分に関する情報を前記少なくとも1つの入力ユニットに送信して、前記少なくとも1つの入力ユニットに、前記合成画像の前記選択された部分を形成する前記入力信号の部分のみを送信することを要求するように構成されている。
【0019】
処理装置は、上記した本発明の方法と同じ利点を有し、特定の種類の合成画像に要求される帯域幅を著しく低減することを可能にする。
本発明の実施形態を図面に示す。図中、同一の特徴部分には同一または類似の参照番号を付している。
【図面の簡単な説明】
【0020】
図1】従来のビジョンミキサの概略ブロック図である。
図2】本発明に係る方法によって操作される映像処理のためのシステムの概略ブロック図である。
図3】映像処理のためのシステムの別の概略ブロック図である。
図4図4A〜4Fは、合成画像の異なるレベルを示す図である。
図5】本発明に係る方法を示すフローチャートである。
【発明を実施するための形態】
【0021】
図1は、概してミキサとも呼ばれる従来のビジョンミキサ100の概略ブロック図を示す。ミキサ100は、それぞれ矢印103,104によって表された複数の映像入力および複数の映像出力を有するクロスポイントマトリックスまたはマトリックス102を備える。プロ用ビジョンミキサは、映像データを受信または送信するためにシリアルデジタルインタフェース(SDI)デジタルデータを使用している。SDIデジタルデータはまた、埋込み音声ストリーム、補助データ、クロックデータ、およびメタデータを含む。1.5Gbit/sのデータストリーム(1080i/720pピクチャフォーマット)には、16の埋込み音声チャネルがあり、3.0Gbit/sのデータストリーム(1080pピクチャフォーマット)には、32の埋込み音声ストリームがある。ミキサ100は他のフォーマットでデジタルデータを送受信することもできる。マトリックス102は、ユーザコマンドに応答して映像入力のいずれか1つを映像出力のいずれか1つと接続するように構成される。マトリックス102の出力チャネルはミキサの映像効果ステージ(M/Eステージ)105に提供される。M/Eステージ105によって処理される映像出力信号は矢印106により示される。ミキサ100の機能性は、映像入力信号の処理を制御および実行するため、ならびに所望の映像出力信号を生成および制作するために、制御コマンドをユーザが入力可能な入力ユニット107によって制御される。入力ユニット107は、データおよび制御バス108を介して制御コマンドを制御ユニット109に伝送する。制御ユニット109はユーザ入力コマンドを解釈し、対応するコマンド信号をマトリックス102およびM/Eステージ105にアドレス指定する。この目的のために、制御ユニット109は、それぞれデータおよび制御バス111,112により、マトリックス102およびM/Eステージ105に接続される。バス108,111,112は、制御ユニット109および入力ユニット107への返信メッセージを可能にする双方向バスである。返信メッセージは、マトリックス102およびM/Eステージ105の動作状態のフィードバックを提供する。入力ユニット107は、ユーザの情報のために、ミキサ100の動作状態を反映する状態インジケータを表示する。
【0022】
最新のビジョンミキサは、上述の通りさらに多くの映像入力および出力チャネルが設けられ、最大8つのダウンストリームキーヤーを含む。その結果、そのような最新のビジョンミキサには1000を超す押しボタンが設けられる。明らかに、最新のビジョンミキサは操作が難しく、複雑かつ高価なハードウェア装置である。
【0023】
図2は、本願と同一出願人によって出願された欧州特許出願第12175474.1号明細書に詳細に記載されている、映像および/または音声信号を処理するための代替的システムのアーキテクチャの概略ブロック図を示す。この発明によるシステムでの提案されたアーキテクチャは、サーバ、グラフィック処理ユニット(GPU)、および高速データリンクのような標準化されたIT技術コンポーネントにハードウェアプラットホームを構築することを可能にする。典型的には、これらの標準化ITコンポーネントは、専用の放送機コンポーネントより安価である。提案のシステムは、コスト上の利点以外に、上述したITコンポーネントの領域の技術的進歩から自動的に利益を得る。提案のシステムでは、映像処理ハードウェアはより小さく柔軟な映像処理ユニットに分割され、かつ専用の制御、映像、および音声相互接続を結合して、個々の処理ユニット間の1つの論理データリンクにする。データリンクは、信頼できる一定の時間関係を有するように設計される。データリンクは典型的には、LANまたはWANのような信頼できる双方向高速データ接続に基づく。個々の処理ユニットは、リアルタイム処理挙動を達成しあるいは超えさえするためにできるだけ高速で、独立して働く。通常、リアルタイム処理とは、次の映像フレームが到着するまでに処理が完了することを意味する。したがって、用語「リアルタイム」は相対的用語であり、映像フレームレートに依存する。システムは、同時処理による全体的制作リアルタイム挙動が達成されることを確実にし、一貫した制作信号PGM−OUTを生成する。この一般的概念を以下にさらに詳しく説明する。
【0024】
本発明に係る映像処理システムでは、映像処理ハードウェアは、制作の地理的分布に従って、すなわち図2に概略的に示すように、制作を可能にするリソースの地理的分布に従って、処理ユニット201,203,205,207に編成される。各処理ユニットの技術的コアは、処理アプリケーションフレームワークおよび専用アルゴリズムによって動作するサーバ、1つまたは幾つかのグラフィック処理ユニット(GPU)、および高速データリンクである。処理アプリケーションフレームワークおよびアルゴリズムはソフトウェアで実現される。アルゴリズムは、従来のビジョンミキサの機能性の範囲を超えて、さらなる機能性を実現するように構成可能かつ拡張可能である。映像信号は、市販のグラフィックカードのGPUによって処理される。したがって、専用ハードウェアによる従来の映像処理は、標準化ITコンポーネントで実行されるソフトウェアに置き換えられる。GPUの全ての処理能力が利用可能であり、新しい映像効果が可能になる。
【0025】
オペレータは制作全体を、それがあたかもコントロールルームに隣接する単一の制作現場で行われているかのように制御する。制作プロセス全体が、専用映像/音声および制御ルーティングから共通データリンクに移動される。SDI接続のような個別配線ハードウェアは標準化データネットワークに置き換えられる。データネットワークにおける全ての信号のルーティングは双方向であり、専用マルチビュー出力のような制作出力およびモニタリング信号は、余分なケーブル配線費用無しにネットワークに接続される任意の制作ユニットにルーティングすることができる。
【0026】
高速データネットワークは映画撮影スタジオまたはTVスタジオのような映像制作現場だけでなく、広域分散ネットワーク、例えば多数の10Gイーサネット(登録商標)またはインフィニバンドでも、ますます利用可能になっている。
【0027】
スタジオにおいて、プロ用映像ネットワーキングとは、映像コンテンツが圧縮されずに伝送されることを意味する。HDTVフォーマットの場合、非圧縮音声および映像データが使用されるスタジオ環境では、結果的に1.5Gbit/sの1080i/720pデータレートが得られる。HDフォーマット1080pの場合、結果的に3.0Gbit/sの正味データレートさえも得られる。
【0028】
再び図2に関連して、全てのブロックは、全体を参照番号200で示されるシステムに属する分散処理ユニットの1つを表す。図2に示す例示的実施形態では、処理ユニット201はフランクフルトのサッカー競技場に位置する。処理ユニット201は、競技場からのカメラ信号、ローカルスローモーションサーバからのスローモーション映像、および最終的に現地でインタビューが行われる場所からの音声および映像信号をローカルソース202として受信する。処理ユニット203もまたフランクフルトに位置するが、処理ユニット201と必ずしも同一場所である必要はない。処理ユニット203は、インタビュールームのライブプレゼンタからのカメラ信号をローカルソース204として受信する。処理ユニット205はベルリンに位置し、進行中の制作に追加の処理能力を提供するだけでなく、例えば広告クリップが格納されているアーカイブおよびサーバへのアクセスをももたらす主処理室を表す。アーカイブおよびサーバはローカルソース206として示される。ローカルソース202,204,206は、映像および/または音声信号をSDIまたはストリーミングデータとして提供する。最後に、ライブ制作を制御しかつ監視するミュンヘンに位置する、ライブ制御ユニット(LCU)を表す処理ユニット207が存在する。制作結果は、放送されるために映像および音声信号PGM−OUT208,209として処理ユニット203,205から出力される。処理ユニット201,203,205,207は、図2に示すように信頼できる双方向高速データリンク210により互いに相互接続される。データリンク210は処理ユニット201,203,205,207間の通信を可能にし、制作ユニット間に一定の既知の信号遅延をもたらす。高速データリンク210は、特定のハードウェアの実現に依存しない論理データリンクを表すことに留意されたい。例えば、データリンク210は幾つかのケーブル1組により実現することができる。図2に示す状況では、データリンク210はインターネットプロトコル(IP)広域ネットワーク(WAN)である。WANでは、映像処理の要件を満たすために、データパッケージがネットワークで送信されたのと同じシーケンスで受信されることを確実にするように、特別な処置を講じなければならない。システムが単一の大きいビジョンミキサのように挙動するように、適切な処置はネットワークのプロトコルおよび/またはハードウェアレベルで講じることができる。
【0029】
実際には、従来のハードウェアベースのビジョンミキサとIPネットワークによって接続された幾つかの処理ユニットを利用するソフトウェアベースのビジョンミキサの適用には違いが無い。しかし後者はより注意深い帯域幅管理を必要とする。従来のハードウェアベースのビジョンミキサでは、各入力信号に専用のハードウェア接続が設けられ、その結果、各入力チャネルに利用可能な充分な帯域幅が常に存在する。対照的に、処理ユニット間のリンク210は通常、利用可能な全ての入力信号を同時に搬送することができず、それについては、図3に関連してさらに詳しく説明する。
【0030】
図3は、図2に示した種類の映像/音声処理システムの異なるブロック図を示す。図3は、入力ユニット301A〜301Dに対し、1つのネットワークスイッチ302および1つの処理ユニット303を示す。ネットワークスイッチ302はネットワークリンク304によって一方では入力ユニット301A〜301Dに、かつ他方では処理ユニット303に接続される。実用的な実施形態では、入力ユニット301A〜301Dはコンピュータサーバとして実現される。各コンピュータは幾つかのI/OカードまたはI/Oモジュールを備え、各I/OカードまたはI/Oモジュールは多数のBNCまたはSDI入力を有する。各入力ユニット301A〜301Dは、20の入力305A〜305Dを有する。すなわち、システムは全部で80の信号入力を有する。入力305A〜305Dは例えばカメラ信号、デジタル映像録画装置等の出力信号を受信する。ネットワークリンクはIPベースのコンピュータネットワークとして実現され、6〜10GBのデータレートを提供する。他の実施形態では、ネットワークは40〜100GBのデータレートを提供することができる。図4Aでは、各入力信号は同一帯域幅を有すると想定され、したがって、1つの入力信号に対する所要帯域幅が既知であるため、保証されたデータレートは、データまたはネットワークリンク304が所定数の入力信号を伝送することを可能にする。1つの入力信号は「チャネル」とも呼ばれる。図3は、保証されたデータレートをチャネルの整数倍として示す。図3に示した実施例では、入力ユニット301A,301B,301Cは3つの入力信号(チャネル)を、かつ入力ユニット301Dは2つの入力信号(チャネル)をネットワークスイッチ302にそれぞれ伝送することができることが分かる。
【0031】
しかし、現在の映像制作では、制作信号は多くの異なるソース信号から成る合成画像(または合成信号)である。そのような合成画像の典型的な例はニュース番組、販売番組等であり、画像のかなりの部分が、タイルまたはバーとして挿入される広告、株式市場情報、ニュース速報等から構成される。ほとんどの場合、画面の底部および/または左側のセクションが、上述したタイルまたはバーで構成される。合成画像の生成に関与する入力信号の総数は、容易に約15に達することができる。今日では関与する信号の各々が全帯域幅で伝送されるので、入力ユニットおよび処理ユニットを接続するネットワークは、対応する数のチャネルを伝送するために充分な帯域幅を提供することが必要になる。それに加えて、各画像挿入は2つの信号、すなわち実画像情報を含む第1信号(「フィル信号」)と、第1信号を背景信号にいかに挿入すべきかの情報を含む第2信号とで構成される。この第2信号は「キー信号」と呼ばれ(一般的コンピュータグラフィックプログラムでは「アルファチャネル」と呼ばれる)、クロミナンス信号成分および輝度信号成分を含む。ただし、キー信号はクロミナンス情報を含まない。輝度信号成分における輝度情報は、挿入の仕方を定義する。最も単純な事例では、挿入されない領域に対しては、輝度信号成分は黒(0%信号レベル)であり、挿入される領域に対しては白(100%信号レベル)である。透明な挿入のある(例えばロゴがフェードアウト境界を有する)領域の場合、キー信号は徐々に100%から0%になる。実際には、フィル信号には輝度信号成分の信号レベルを表すキー信号の輝度値kが乗算され、主入力信号(背景信号)には係数(1−k)が乗算され、合成画像で2つの信号を重ね合わせることによってフィル信号が埋め込まれる「穴」が形成される。輝度値kは、それぞれ100%および0%の信号レベルに対応する1から0まで線形的に変動する。明らかに、伝送される画像部分は常に、キー信号の輝度値kが0とは異なる領域を完全に含まなければならない。いずれの場合も、キー信号に対しては、輝度成分だけを考慮する必要がある。したがって、本発明の実施形態では、キー信号のクロミナンス信号成分は伝送されず、このチャネルでは手始めに50%の帯域幅が節約される。キー信号のクロミナンス信号成分を除去することによる帯域幅の節約にかかわらず、図3に関連して説明した通り、これらの信号を全て伝送するために必要な帯域幅は依然として、IPネットワークでは容易に利用できない。
【0032】
したがって、本発明に係る方法は、図4A図4Fに関連して記載する別の追加的方法を提唱する。
図4Aは、販売番組の合成画像を示す。合成画像401または信号は、ユーザがTVの販売番組を見るときに合成画像を見るのと同じ方法で、スクリーンに表示される。画像401の主要部分402は、2人の人間が例えば新製品について会話しているスタジオ状況である。以下で、この入力信号を主入力信号と呼ぶ。合成画像401の右上角部に放送チャネルのロゴ403aが存在する。ロゴ403aの周りの領域は参照番号403bで示される。画像401の左側のセクションには、広告を示す2つの挿入タイルまたはピクチャインピクチャ404,405が存在する。最後に、画像401の底部に挿入されたテキストバー406が存在する。図4Aに示す合成画像401は、9つの異なる入力信号(主要部分402の主入力信号、ロゴ403a、広告404,405、ならびにテキストバー406のフィル信号およびキー信号、すなわち1+4×2=9)だけで構成されるので、多少簡素化されているが、それにもかかわらず、本発明の原理を説明するのによく適している。
【0033】
図4Bは、ロゴ403aの入力信号を示す。画像401に実際に表示されかつ領域403bを付随する、対応する入力信号の部分のみが処理ユニットに伝送されることに留意されたい。この入力信号の斜線部は伝送されず、したがって、信号を伝送するための所要帯域幅はかなり、例えば80〜90%低減される。同様に、図4C図4D、および図4Eは、第1広告タイル404、第2広告タイル405、およびテキストバー406の入力信号を示す。これらの入力信号の全てで、画像401の車線領域を表す斜線信号部は伝送されない。同様に、図4B図4Eに示す斜線領域について、対応するキー信号は伝送されない。主入力信号は完全に送信されるので、ユーザは、全ての挿入部をユーザの自由裁量でフェードインまたはフェードアウトすることができる。一般的に、記載する方法は、入力信号の関連コンテンツだけを送信することに基づく。入力信号の関連コンテンツは入力信号の関連部分に対応する。この方法の前提条件は、関連コンテンツが画像の予め定められた位置にありかつそこに維持され、かつ一定不変の予め定められたサイズを有することである。
【0034】
しかし、全ての挿入をフェードインまたはフェードアウトすることができるそのような種類の柔軟性は、所用帯域幅をさらに限定することに比べて、かつ合成画像を形成するためにどれだけの数の入力信号が使用されるかにかかわらず、あまり重要でない状況が存在する場合がある。したがって、図4Fに示す代替的実施形態は、後で画像挿入部に置換される主画像信号の信号部分を送信しない。しかし、この場合、図4Fに示す斜線領域に対応する暗い領域が合成画像401に残るので、合成画像における挿入チューブ部分のフェードアウトはもはや実現することができない。合成画像を形成するためにどれだけの数の入力信号が使用されるかに関係なく、合成画像を送信するための所要帯域幅は1つの単独チャネルに維持される。図4Fは、画像401の主要部分402の入力信号を示す。図4Fに斜線領域によって示される通り、他の入力信号の以前に識別された関連部分は主入力信号から除外される。図4B図4Eに関して説明したのと同様に、斜線領域に対応する主入力信号の部分は、入力ユニットによって送信されない。
【0035】
本発明の方法の手法を実際にいかに実現するかを、図5に示したフローチャートに関連してさらに詳しく説明する。
第1ステップ501で、画像/音声処理システムを操作するユーザは、利用可能な入力信号を1つずつ見ていき、主画像部分402に使用される主入力信号を選択する。ステップ502で、ユーザは再び他の利用可能な入力信号を1つずつ見ていき、合成画像に使用されるさらなる入力信号を選択する。ひとたびさらなる入力信号が選択されると、ユーザはステップ503で、合成画像の関連部分に対応する入力信号の関連部分を識別する。例えばロゴ403aだけを提供する入力信号の場合、ロゴ403aが表示される領域403bに対応する入力信号部が関連する。ステップ504で、入力信号のどの部分が関連するかについての情報は、入力信号の関連部分が使用される合成画像の領域を記載する座標により伝達される。入力信号を提供する入力ユニットは該情報を受信し、それに応答してその後、対応する信号部分だけを送信する。ステップ506で、ユーザは、さらに入力信号を合成画像に組み込みたいかどうかを決定する。答えが肯定であれば、フィードバックループ507で示されるように、ステップ502で再びプロセスが開始される。ユーザによって合成画像のために選択された入力信号の全ての関連部分が画定され、かつ対応する情報が、関連入力信号を提供する入力ユニットに通信されるまで、プロセスは全ての入力信号に対して繰り返される。ユーザは一度に単一の入力信号を見るだけであるので、選択プロセス中に単一のチャネルを送信するための帯域幅だけが要求される。
【0036】
処理ユニットは、画像の主要部分の領域を他の入力信号の関連部分に置換する。他の入力信号の関連部分は主入力信号に対して補足され、したがって所要帯域幅は入力信号の数が増大するにつれて増大する。
【0037】
主入力信号の部分が送信されない図4Fの代替的実施形態では、図5に破線で示された追加ステップ505が要求される。ステップ505で、入力信号の関連部分に関して同じ情報が、合成画像の主要部分を提供する入力ユニットに送信される。主入力信号に関連して、情報は相補的に使用される。すなわち、主入力信号の識別された部分は、もはや処理ユニットに送信されない。この方法の有利な結果は、追加入力信号の全ての補足部分に対し、主入力信号の対応部分が除外されるので、合成画像を作成するためにどれだけの数の入力信号が使用されるかに関係なく、単一チャネルに対応する帯域幅だけが必要とされることである。
【0038】
本発明に係る方法は、IPネットワークによって接続された複数の入力ユニットおよび処理ユニットを含む映像/音声処理システムで、合成画像を制作するための帯域幅要件を効果的に制限する。
【符号の説明】
【0039】
100 ビジョンミキサ
102 クロスポイントマトリックス
103 入力信号
104 出力信号
105 ミキシングおよび映像効果ステージ
106 映像出力信号の処理
107 入力ユニット
108 制御バス
109 制御ユニット
111 制御ボックス
112 制御ボックス
200 処理システム
201 処理ユニット
202 外部ソース
203 処理ユニット
204 外部ソース
205 処理ユニット
206 ローカルソース
207 処理ユニット
208、209 出力信号
210 データリンク
301A〜301D 入力ユニット
302 ネットワークスイッチ
303 処理ユニット
304 ネットワークリンク
305A〜305D 入力
401 合成画像
402 主要部分
403a ロゴ
403b ロゴの領域
404、405 広告タイル
406 テキストバー
図1
図2
図3
図4A
図4B
図4C
図4D
図4E
図4F
図5