(19)【発行国】日本国特許庁(JP)
(12)【公報種別】特許公報(B2)
(11)【特許番号】
(24)【登録日】2024-11-18
(45)【発行日】2024-11-26
(54)【発明の名称】映像信号を合成する装置、方法及びプログラム
(51)【国際特許分類】
H04N 21/238 20110101AFI20241119BHJP
H04N 7/15 20060101ALI20241119BHJP
【FI】
H04N21/238
H04N7/15
(21)【出願番号】P 2022570805
(86)(22)【出願日】2020-12-22
(86)【国際出願番号】 JP2020047864
(87)【国際公開番号】W WO2022137325
(87)【国際公開日】2022-06-30
【審査請求日】2023-04-20
(73)【特許権者】
【識別番号】000004226
【氏名又は名称】日本電信電話株式会社
(74)【代理人】
【識別番号】100119677
【氏名又は名称】岡田 賢治
(74)【代理人】
【識別番号】100160495
【氏名又は名称】畑 雅明
(74)【代理人】
【識別番号】100115794
【氏名又は名称】今下 勝博
(72)【発明者】
【氏名】藤原 稔久
(72)【発明者】
【氏名】小野 央也
(72)【発明者】
【氏名】福井 達也
(72)【発明者】
【氏名】池田 智彦
(72)【発明者】
【氏名】椎名 亮太
【審査官】鈴木 隆夫
(56)【参考文献】
【文献】特開2011-044826(JP,A)
【文献】特開2018-182410(JP,A)
【文献】特開2009-130639(JP,A)
【文献】特開2015-165628(JP,A)
【文献】特開2009-265319(JP,A)
(58)【調査した分野】(Int.Cl.,DB名)
H04N 21/00-21/858
H04N 7/15
(57)【特許請求の範囲】
【請求項1】
非同期の互いに異なる複数の映像信号を構成する各入力フレームの入力タイミングを検出し、
前記複数の映像信号のうちの設定された数の映像信号が入力されると、前記設定された数の映像信号の合成処理を順次開始することで、前記複数の映像信号の画面を前記入力タイミングの早い順に、
前記複数の映像信号の数に応じて複数の領域に分割された合成画面において、走査線を走査するタイミングの早い
前記領域から順に前記合成画面に配置する合成処理を行い、
前記複数の映像信号を1つの映像信号に合成した出力フレームを生成する、
映像合成装置。
【請求項2】
複数の映像信号を構成する各入力フレームの入力タイミングを検出し、
前記複数の映像信号のうちの設定された数の映像信号が入力されると、前記設定された数の映像信号の合成処理を順次開始し、
前記複数の映像信号を1つの映像信号に合成した出力フレームを生成し、
前記複数の映像信号のうちの前記設定された数の映像信号の入力完了時点と前記複数の映像信号の最後の映像信号の入力完了時点との時間差を、前記複数の映像信号の数若しくは合成画面の配置のいずれか又は両方に応じて定められる時間と比較し、合成処理のタイミングを調整する、
映像合成装置。
【請求項3】
前記時間差が前記複数の映像信号の数若しくは合成画面の配置のいずれか又は両方に応じて定められる時間よりも長い場合は、前記設定された数の映像信号の合成処理のタイミングを調整し、
前記時間差が前記複数の映像信号の数若しくは合成画面の配置のいずれか又は両方に応じて定められる時間よりも短い場合は、前記複数の映像信号のうちの残りの映像信号の合成処理のタイミングを調整する、
請求項2に記載の映像合成装置。
【請求項4】
映像合成装置が、
非同期の互いに異なる複数の映像信号を構成する各入力フレームの入力タイミングを検出し、
前記複数の映像信号のうちの設定された数の映像信号が入力されると、前記設定された数の映像信号の合成処理を順次開始することで、前記複数の映像信号の画面を前記入力タイミングの早い順に、
前記複数の映像信号の数に応じて複数の領域に分割された合成画面において
、走査線を走査するタイミングの早い
前記領域から順に前記合成画面に配置する合成処理を行い、
前記複数の映像信号を1つの映像信号に合成した出力フレームを生成する、
映像合成方法。
【請求項5】
映像合成装置が、
複数の映像信号を構成する各入力フレームの入力タイミングを検出し、
前記複数の映像信号のうちの設定された数の映像信号が入力されると、前記設定された数の映像信号の合成処理を順次開始し、
前記複数の映像信号を1つの映像信号に合成した出力フレームを生成し、
前記複数の映像信号のうちの前記設定された数の映像信号の入力完了時点と前記複数の映像信号の最後の映像信号の入力完了時点との時間差を、前記複数の映像信号の数若しくは合成画面の配置のいずれか又は両方に応じて定められる時間と比較し、合成処理のタイミングを調整する、
映像合成方法。
【請求項6】
前記映像合成装置が、
前記時間差が前記複数の映像信号の数若しくは合成画面の配置のいずれか又は両方に応じて定められる時間よりも長い場合は、前記設定された数の映像信号の合成処理のタイミングを調整し、
前記時間差が前記複数の映像信号の数若しくは合成画面の配置のいずれか又は両方に応じて定められる時間よりも短い場合は、前記複数の映像信号のうちの残りの映像信号の合成処理のタイミングを調整する、
請求項5に記載の映像合成方法。
【請求項7】
請求項1から3のいずれかに記載の映像合成装置に備わる各機能部としてコンピュータを実現させるためのプログラム。
【発明の詳細な説明】
【技術分野】
【0001】
複数の映像入力信号から、画面を1つに合成し、出力する、映像合成システムに関する。
【背景技術】
【0002】
近年、多くの映像デバイスが利用されている。このような多くの映像デバイスの映像には、多様な画素数(解像度)、フレームレート等が利用されている。この映像デバイスの映像信号は、規格によって、物理的な信号、コントロール信号等に差異があるものの、1画面をそのフレームレート分の1の時間を使って伝送する。
【0003】
これらの映像の利用方法には、テレビ会議など、複数のカメラをカメラの数よりも少ないモニタで表示するような形態がある。このような場合、複数の映像を、例えば1つの画面上に分割表示することや、ある映像画面中に、その他の映像画面縮小表示などをしてはめ込むことなどの、画面合成を行う。
【0004】
通常、映像信号のタイミングは同期されておらず、合成する他の映像信号のタイミングが異なることから、信号をメモリなどに一時的にバッファリングしてから、合成する。結果として、合成された画面の出力には遅延が発生する。
【0005】
遠隔地などでの合奏等をこのような画面合成を行うテレビ会議で行うことを想定すると、この合成に関わる遅延は、その実現性を大きく損なう。例えば、1秒間に120拍の曲(以下、120BPM(Beat Per Minute))であれば、1拍の時間は、60/120秒=500ミリ秒である。仮にこれを、5%の精度で合わせることが必要であるとすると、500×0.05=25ミリ秒以下にカメラで撮影して表示するまでの遅延を抑える必要がある。
【0006】
カメラで撮影して表示するまでには、実際には、合成に関わる処理以外に、カメラでの画像処理時間、モニタでの表示時間、伝送に関わる時間などの、その他の遅延も含む必要がある。結果として、従来技術では、遠隔地で相互に映像を見ながらの合奏等のタイミングが重視される用途での、協調作業は困難であった。
【0007】
そこで、低遅延要求が厳しい協調作業に対して、複数拠点などの複数の映像信号を合成するシステムで、非同期の映像信号の入力から、合成された映像信号の出力までの時間を低遅延化するシステムの提供が必要である。
【先行技術文献】
【非特許文献】
【0008】
【文献】VESA and Industry Standards and Guidelines for Computer Display Monitor Timing (DMT), Version 1.0, Rev. 13, February 8, 2013
【発明の概要】
【発明が解決しようとする課題】
【0009】
本開示は、合成映像の出力までの遅延時間を短縮することを目的とする。
【課題を解決するための手段】
【0010】
本開示は、複数の非同期の映像を合成して表示する装置において、入力された複数の映像信号から入力タイミングの早い順に上部から画面を配置する合成処理を行う。
【0011】
本開示の映像合成装置は、
複数の映像信号を構成する各入力フレームの入力タイミングを検出し、
前記複数の映像信号のうちの設定された数の映像信号が入力されると、前記設定された数の映像信号の合成処理を順次開始し、
前記複数の映像信号を1つの映像信号に合成した出力フレームを生成する。
【0012】
本開示の映像合成方法は、
映像合成装置が、
複数の映像信号を構成する各入力フレームの入力タイミングを検出し、
前記複数の映像信号のうちの設定された数の映像信号が入力されると、前記設定された数の映像信号の合成処理を順次開始し、
前記複数の映像信号を1つの映像信号に合成した出力フレームを生成する。
【0013】
本開示のプログラムは、本開示に係る装置に備わる各機能部としてコンピュータを実現させるためのプログラムであり、本開示に係る装置が実行する方法に備わる各ステップをコンピュータに実行させるためのプログラムである。
【発明の効果】
【0014】
本開示は、合成映像の出力までの遅延時間を短縮することができる。
【図面の簡単な説明】
【0015】
【
図1】映像信号に含まれる画面の情報の一例を示す。
【
図3】本開示に関連する映像合成方法の一例を示す。
【
図8】本実施形態に係る映像合成装置の構成例を示す。
【発明を実施するための形態】
【0016】
以下、本開示の実施形態について、図面を参照しながら詳細に説明する。なお、本開示は、以下に示す実施形態に限定されるものではない。これらの実施の例は例示に過ぎず、本開示は当業者の知識に基づいて種々の変更、改良を施した形態で実施することができる。なお、本明細書及び図面において符号が同じ構成要素は、相互に同一のものを示すものとする。
【0017】
図1に、映像信号に含まれる画面の情報の一例を示す。画面の情報は、画面を横方向に1つの走査線21毎に走査して、順次下の走査線21を走査することで伝送される。この走査には、表示画面24の他、ブランキング部分22、また、ボーダ部分23などのオーバヘッド情報/信号の走査を含む。ブランキング部分22に、制御情報や音声情報など、映像情報以外の情報を含む場合もある。(例えば、非特許文献1、第3章参照。)
【0018】
図2に、映像信号の合成例を示す。本開示では、一例として、映像合成装置に4つの映像信号が入力され、映像合成装置が1つの映像信号に合成して出力する例を示す。映像信号では1画面をそのフレームレート分の1の時間を使って伝送する。例えば、1秒間に60フレームの映像信号であれば、1/60秒、すなわち約16.7ミリ秒を掛けて1画面の映像信号を伝送する(以下、60fps(Frame per Second))。映像信号に含まれる各時点での1画面の情報を「フレーム」と称し、映像合成装置に入力される各映像信号の1画面の情報を「入力フレーム」、映像合成装置から出力される合成された1画面の情報を「出力フレーム」と称する。
【0019】
例えば、
図3に示すように、映像合成装置が、全ての入力フレームを読み込んでから、1つの出力フレームに合成し、出力する場合を考える。この場合、各入力フレームのフレーム時間をT_f、合成処理時間をT_pとすると、出力フレームの出力は、最初の入力1の入力開始時点から最大で、2T_f+T_p遅れることとなる。フレームレートが60fpsの場合、少なくとも33.3ミリ秒の遅延が生じる。
【0020】
本開示の装置及び方法は、複数の非同期の映像を入力し、それらの画像を合成するシステムであって、入力タイミングの早い順に合成処理を開始し、画面の上部に配置することを特徴とする。
【0021】
本実施形態では、4入力、4分割1画面出力で各入力が1/4 T_f時間ずつずれがある場合について述べる。入力タイミングが早い順に入力1,2,3,4とする。この場合、4つの映像信号のうちの入力1及び入力2の映像信号が表示画面24の上部に表示され、残りの入力3及び入力4の映像信号が表示画面24の下部に表示される。そこで、本実施形態では、4つの映像信号のうちの2つの映像信号が入力されると、当該2つの映像信号の合成処理を開始する。簡略化のため、映像信号のブランキング部分22、ボーダ部分23については除外して、表示画面24の部分の信号のみについて説明する。
【0022】
図4に、本開示の第1の合成例を示す。入力2の入力が完了した時点で、合成処理(1)を始め、表示画面24の上部への出力を開始する。
次いで、入力4の入力が完了した時点で、合成処理(2)を始め、表示画面24の下部への出力を開始する。
この場合、入力1の入力開始時点から上部の表示画面24の出力開始時点までの最大遅延時間は(5/4T_f+T_p)となる。これにより、3/4 T_f時間、
図3に示す例より出力遅延を短縮できる。例えば、フレームレートが60fpsの場合、21ミリ秒+T_pの遅延になる。
【0023】
次いで、各入力が1/4 T_f時間ずつのずれではない場合について述べる。
図5に示すように、入力2と入力4の入力フレームの末尾の時間差T_in2toin4がT_f/2より長い場合は、入力1及び入力2を合成した上部の表示画面24の出力に続いて下部の表示画面24の出力が間に合うよう、入力2の入力完了後に、少なくともT_in2toin4-T_f/2時間、合成処理(1)の開始を待つ。もしくは、合成処理(1)を実施してから、T_in2toin4-T_f/2時間上部画面の出力フレームの出力を待つようにしてもよい。
【0024】
図6に示すように、入力2と入力4の入力フレームの末尾の時間差T_in2toin4がT_f/2より短い場合は、上部の表示画面24の出力に続いて下部の表示画面24の出力が間に合うよう、入力4の入力完了後に、T_f/2-T_in2toin4時間、合成処理(2)の開始を待つ。もしくは、合成処理(2)を実施してからT_f/2-T_in2toin4時間、下部画面の出力フレームの出力を待つようにしてもよい。
【0025】
なお、本実施形態では、
図2に示すような、4つの映像信号を上2画面下2画面の1つの映像信号に合成して出力する例を示す。このため、
図5及び
図6の例では、入力フレームの末尾の時間差を入力2と入力4の時間差とし、その比較対象をT_f/2と比較した。しかし、入力フレームの末尾の時間差及びこれの比較対象は、合成する映像信号の数及び画面の配置に応じて定められる任意の数でありうる。例えば、6つの映像信号を上2画面、中2画面、下3画面の1つの映像信号に合成する場合、入力フレームの末尾の時間差を入力4と入力6の時間差とし、その比較対象をT_f/3とすればよい。
【0026】
なお、実際の映像信号には、前記したブランキング部分やボーダ部分などのオーバヘッド部分あるため、前記比較対象のT_f/2や、T_f/3は、表示画面24に対しての信号に対しての数値であり、オーバヘッド部分に応じて、補正する必要がある。
【0027】
図7を参照して、前記までの方法をパイプライン処理化した場合について述べる。パイプライン化合成処理時間をT_pp(Time of Pipelined Processing)とする。ここでの、パイプライン化合成処理時間とは、パイプラインのための最初のオーバヘッド時間(データの読み込み等を含む次段の処理に渡す前の処理全般に要する時間)のみを示し、合成処理は、入力または、出力に合わせて継続的に実行される。パイプライン化合成処理の実態の時間は、後段処理である出力までに、パイプライン処理上の1単位データを処理する時間である。この場合は、映像信号の入力の終了時刻+T_pp時点で、出力フレームの出力が完了するよう処理を開始できる。
【0028】
4入力、4分割1画面出力で、各入力フレームに1/4 T_f時間ずつずれがある場合について述べる。入力タイミングが早い順に入力1,2,3,4とする。簡略化のため、映像信号のブランキング部分22、ボーダ部分23については除外して、表示画面24の信号のみについて説明する。
【0029】
入力2の入力完了時刻T_2EからT_pp時間を経過した時点が、上部の表示画面24の出力完了時点T_UEと一致するように合成処理(1)を始め、表示画面24の上部への出力を開始する。
入力4の入力完了時刻T_4EからT_pp時間を経過した時点が、下部の表示画面24の出力完了時点T_DEと一致するように合成処理(2)を始め、表示画面24の下部への出力を開始する。
この場合、入力1の入力開始時点から上部の表示画面24の出力開始時点までの最大遅延時間は(3/4 T_f+T_pp)となる。これにより、
図3に示す例より出力遅延を短縮できる。例えば、フレームレートが60fpsの場合、12.5ミリ秒+T_ppの遅延になる。
【0030】
次いで、各入力が1/4 T_f時間ずつのずれではない場合について述べる。
入力2と入力4の入力フレームの末尾の時間差T_in2toin4がT_f/2より長い場合は、入力1及び入力2を合成した上部の表示画面24の出力に続いて下部の表示画面24の出力が間に合うよう、入力2の入力完了後に、少なくともT_in2toin4-T_f/2時間、合成処理(1)の開始を待つ。もしくは、合成処理(1)を実施してから、T_in2toin4-T_f/2時間出力フレームの出力を待つようにしてもよい。
【0031】
入力2と入力4の入力フレームの末尾の時間差T_in2toin4がT_f/2より短い場合は、上部の表示画面24の出力に続いて下部の表示画面24出力が間に合うよう、入力4の入力完了後に、T_f/2-T_in2toin4時間、合成処理(2)の開始を待つ。もしくは、合成処理(2)を実施してからT_f/2-T_in2toin4時間、出力フレームの出力を待つようにしてもよい。
【0032】
なお、本実施形態では、
図2に示すような、4つの映像信号を上2画面下2画面の1つの映像信号に合成して出力する例を示す。このため、前記の例では、入力フレームの末尾の時間差を入力2と入力4の時間差とし、その比較対象をT_f/2と比較した。しかし、入力フレームの末尾の時間差及びこれの比較対象は、合成する映像信号の数及び画面の配置に応じて定められる任意の数でありうる。例えば、6つの映像信号を上2画面、中2画面、下3画面の1つの映像信号に合成する場合、入力フレームの末尾の時間差を入力4と入力6の時間差とし、その比較対象をT_f/3とすればよい。
【0033】
なお、実際の映像信号には、前記したブランキング部分やボーダ部分などのオーバヘッド部分あるため、前記比較対象のT_f/2や、T_f/3は、表示画面24に対しての信号に対しての数値であり、オーバヘッド部分に応じて、補正する必要がある。
【0034】
図8に、本実施形態に係るシステム構成の一例を示す。本実施形態に係る映像合成装置10は、検出部101、クロスバスイッチ102、アップダウンコンバータ103、バッファ104、画素合成部105を備える。図は4入力1出力であるが、任意の数の入出力でも構わない。
【0035】
101は、N個の入力フレームに対して、フレーム時間内の入力順を検出する機能部である。例えば、
図4及び
図5に示す入力1、2、3、4の入力フレームが入力された入力タイミングを検出し、入力タイミングを用いて入力1、2、3、4の順序を判定する。
102は、クロスバスイッチであり、101からの入力順序の検出結果順に並べ替え出力する機能である。例えば、
図4及び
図5に示す入力1、2、3、4の順に入力フレーム順を並べる。
103は画素数を任意の大きさに拡大縮小を行う、アップダウンコンバータである。例えば、入力1の画素数を、
図2に示す画面の大きさに整合するよう拡大又は縮小する。
102と103は入力(a,b,c,d,…)に対して逆に接続しても構わない。すなわち入力a,b,c,dから103で拡大縮小を行い、その後102で入力1、2、3、4の順に並べ替え出力しても構わない。
104は、各入力フレームを格納するバッファである。103または102の入力をバッファリングして、任意の順序で出力することができる。
105は、画素合成部である。画素合成部105は、出力の全体画面のうち、出力する順に104から画素データを読み出し、合成して出力フレームを生成し、出力する。これにより、
図2に示すような、4つの映像信号が合成された映像が画面に表示される。このタイミングは、前記による。105は、任意のコントロール信号を画面のブランキング部分22に付加しても構わない。
【0036】
本開示の装置は、コンピュータとプログラムによっても実現でき、プログラムを記録媒体に記録することも、ネットワークを通して提供することも可能である。
【0037】
上述の実施形態では4入力、4分割1画面の例を示したが、本開示はこれに限らず、任意の入力に適用できる。また上述の実施形態では、主に入力1~4のフレーム時間T_fが同じ例を示したが、本開示はフレーム時間T_fが異なる入力1~4に対しても適用可能である。
【0038】
(本開示の効果)
非同期の映像入力信号の入力タイミングの早い順に、上部から画面を合成配置し、出力することで、合成後の出力までの遅延時間を短縮することができる。これにより、複数拠点等の複数画面を合成するシステムで低遅延要求が厳しい協調作業が可能となる。
【産業上の利用可能性】
【0039】
本開示は、映像コンテンツやゲームコンテンツを配信する情報通信産業のほか、映像制作に関わる映画、広告、ゲーム産業に適用することができる。
【符号の説明】
【0040】
10:映像合成装置
21:走査線
22:ブランキング部分
23:ボーダ部分
24:表示画面
101:検出部
102:クロスバスイッチ
103:アップダウンコンバータ
104:バッファ
105:画素合成部